DeIMOS/test.py at master · leejtding/DeIMOS · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import silhouette_score
from sklearn.cluster import KMeans
from model import DEIMOS_Model
from preprocess import get_data
from utils import tsne_visualization, save_cluster_images
import random, sys, time

tf.random.set_seed(123)
np.random.seed(123)
random.seed(123)

tsne_params = {
    'learning_rate': 200,
    'perplexity': 25
}

labeled_data, unlabeled_data = get_data('data/hirise-map-proj-v3_2')
orig_data = unlabeled_data

model = DEIMOS_Model(n_clusters=3)

# Pretrain the model using labeled data
if len(sys.argv) >= 2 and sys.argv[1] == 'pretrain':
    model.pretrain_setup(7)
    n_pretrain_epochs = 1
    for i in range(n_pretrain_epochs):
        print(i)
        labeled_data = labeled_data.shuffle(200)
        batched_label_ds = labeled_data.batch(50)
        curr_losses = []
        for j, (batch_img, batch_label) in enumerate(batched_label_ds):
            with tf.GradientTape() as tape:
                logits = model.call_pretrain(batch_img)
                loss = model.loss_pretrain(logits, batch_label)
                grads = tape.gradient(loss, model.trainable_variables)
                model.pretrain_optimizer.apply_gradients(zip(grads, model.trainable_variables))
            curr_losses.append(loss)
        print(f'Epoch loss: {np.mean(curr_losses)}')
    print('Accuracy on last batch: ', end='')
    print(tf.reduce_mean(tf.cast(tf.argmax(logits, axis=1) == tf.cast(batch_label, tf.int64), float)).numpy())

    if len(sys.argv) == 3 and sys.argv[2] == 'kmeans':
        kmeans_model = KMeans(2)
        for i, batch in enumerate(unlabeled_data.batch(50)):
            out_feats = model.call_feat_output(batch)
            if not i:
                full_output = out_feats
            else:
                full_output = np.vstack((full_output, out_feats))
        kmeans_model.fit(full_output)
        predictions = kmeans_model.predict(full_output)
        score = silhouette_score(full_output, predictions)
        print(f'Silhouette Score: {score}')
        tsne_visualization(full_output, predictions, **tsne_params)
        exit()


cluster_vars = [tens for tens in model.trainable_variables if \
    tens.name != 'pretrain_output/kernel:0' and tens.name != 'pretrain_output/bias:0']

# Train loop
n_epochs = 1
for i in range(n_epochs):
    print(i)
    unlabeled_data = unlabeled_data.shuffle(200)
    batched_ds = unlabeled_data.batch(60)
    losses = []
    for j, batch in enumerate(batched_ds):
        with tf.GradientTape() as tape:
            out_feats = model(batch)
            loss, ct = model.loss_w(out_feats)
            if loss is None:
                continue
            grads = tape.gradient(loss, cluster_vars)
            model.optimizer.apply_gradients(zip(grads, cluster_vars))
        losses.append(loss / ct)
    print(f'Last Batch Predictions: {tf.argmax(out_feats, axis=1)}')
    print(f'Average Loss per Example: {np.mean(losses)}')
    if model.upper_bound() > model.lower_bound():
        model.loss_l_update()

# Cluster prediction
predictions = []
batched_ds = orig_data.batch(60)

for i, batch in enumerate(batched_ds):
    out_feats = model(batch, training=False)
    if not i:
        full_output = out_feats
    else:
        full_output = np.vstack((full_output, out_feats))
    batch_preds = model.get_clusters(out_feats).numpy()
    predictions = np.concatenate((predictions, batch_preds))

print(np.histogram(predictions))

save_cluster_images(2, full_output, predictions, orig_data)

try:
    score = silhouette_score(full_output, predictions)
    print(f'Silhouette Score: {score}')
except ValueError:
    print('Model only produced one cluster')

tsne_lrs = [50, 100, 200, 300, 400]
for lr in tsne_lrs:
    tsne_params['learning_rate'] = lr
    tsne_visualization(full_output, predictions, show=False, **tsne_params)
plt.show()