Fast-Neural-Style-Transfer/train.py at master · lovedepment/Fast-Neural-Style-Transfer · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
import os
import time
import argparse

import tqdm
import yaml
import numpy as np

import torch
import torchvision

from utils import util
from nets.nn import TransformerNet, VGG16


def train(config, device, styles):
    # Train config
    config = config['TRAIN']
    saved_models = []  # empty list for saving name of style models

    np.random.seed(config['seed'])
    torch.manual_seed(config['seed'])

    for style in styles:
        style_name = style.split("/")[-1][:-4]
        os.makedirs(f"{config['save_model_dir']}", exist_ok=True)

        # Dataset and dataloader
        train_dataset = torchvision.datasets.ImageFolder(config['dataset'], util.train_transform(config['image_size']))
        train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=config['batch_size'], num_workers=4)

        # Neural Network
        transformer = TransformerNet().to(device)
        vgg = VGG16(requires_grad=False).to(device)
        if torch.cuda.device_count() > 1:
            transformer = torch.nn.DataParallel(transformer)

        # Optimizer and loss
        optimizer = torch.optim.Adam(transformer.parameters(), config['lr'])
        mse_loss = torch.nn.MSELoss()

        # Load style image
        style = util.load_image(style, size=config['style_size'])
        style = util.transform(style)
        style = style.repeat(config['batch_size'], 1, 1, 1).to(device)

        # Extract features
        features_style = vgg(util.normalize_batch(style))
        gram_style = [util.gram_matrix(y) for y in features_style]
        # Train
        print(f'STARTED TRAINING for: {style_name} style')
        log = open('logs.txt', 'a')
        for epoch in range(config['num_epochs']):
            transformer.train()
            metrics = {"content": [], "style": [], "total": []}
            count = 0

            print(('\n' + '%10s' * 2) % ('Epoch', 'GPU'))
            progress_bar = tqdm.tqdm(enumerate(train_loader), total=len(train_loader))
            for batch_id, (x, _) in progress_bar:
                n_batch = len(x)
                count += n_batch
                optimizer.zero_grad()

                x = x.to(device)
                y = transformer(x)

                y = util.normalize_batch(y)
                x = util.normalize_batch(x)

                features_y = vgg(y)
                features_x = vgg(x)

                content_loss = config['content_weight'] * mse_loss(features_y.relu2_2, features_x.relu2_2)

                style_loss = 0.
                for ft_y, gm_s in zip(features_y, gram_style):
                    gm_y = util.gram_matrix(ft_y)
                    style_loss += mse_loss(gm_y, gm_s[:n_batch, :, :])
                style_loss *= config['style_weight']

                total_loss = content_loss + style_loss
                total_loss.backward()
                optimizer.step()

                metrics['content'] += [content_loss.item()]
                metrics['style'] += [style_loss.item()]
                metrics['total'] += [total_loss.item()]

                if (batch_id + 1) % config['log_interval'] == 0:
                    info = "{}\tEpoch {}:\t[{}/{}]\tContent: {:.2f}\tStyle: {:.2f}\tTotal: {:.2f}\n".format(
                        time.ctime(), epoch + 1, count, len(train_dataset),
                        np.mean(metrics['content']),
                        np.mean(metrics['style']),
                        np.mean(metrics['total'])
                    )
                    log.write(info)

                memory = '%.3gG' % (torch.cuda.memory_reserved() / 1E9 if torch.cuda.is_available() else 0)
                s = (('%10s' + '%10s') % (epoch + 1, memory))
                progress_bar.set_description(s)

        # save model
        transformer.eval().cpu()
        model_name = f'{style_name}.pth'
        saved_models.append(model_name)
        save_model_path = os.path.join(config['save_model_dir'], model_name)
        torch.save(transformer.state_dict(), save_model_path)
        log.close()
    print("\nTrain finished: ", *saved_models)


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument('--styles', required=True, type=str,
                        help='path to folder')  # path to a folder of style images
    args = parser.parse_args()

    # List of style images
    styles = [os.path.join(args.styles, style) for style in os.listdir(args.styles)]

    # Default config
    with open(r'utils/config.yaml') as file:
        config = yaml.load(file, Loader=yaml.FullLoader)

    # Configure device
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

    train(config=config, device=device, styles=styles)