ADL-Deep-Modeling/pretraining.py at main · junaidiiith/ADL-Deep-Modeling · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
from parameters import parse_args
from nx2str import get_graph_data
from training_utils import train_umlgpt, train_hugging_face_gpt
from uml_data_generation import get_kfold_lm_data, get_promptized_data_for_generation
from common_utils import create_run_config
from constants import UMLGPTMODEL
import streamlit as st


"""
This file contains the code for pretraining the UML-GPT model.
The pretraining is done on the graph data.
"""

def main(args):

    create_run_config(args)
    print(args)

    # exit(0)
    graph_data = get_graph_data(args.graphs_file)
    for _, data in enumerate(get_kfold_lm_data(graph_data, seed=args.seed, phase=args.phase)):
        print("Running fold:", _)


        with st.spinner("Creating dataset..."):
            dataset = get_promptized_data_for_generation(data)


        print("Initializing...", dataset.keys())
        # print(dataset['test'][0])
        if args.gpt_model == UMLGPTMODEL:
            train_umlgpt(dataset, args)
        else:
            train_hugging_face_gpt(dataset, args)

        ### Comment the break statement to train on all the folds
        break

# if __name__ == '__main__':
#     args = parse_args()
#     main(args)