world_model/data_collect.py at main · TmacAaron/world_model · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
import carla
import gym
import math
from pathlib import Path
import json
import numpy as np
from tqdm import tqdm
# import wandb
from clearml import Task
import pandas as pd
import hydra
from omegaconf import DictConfig, OmegaConf
import logging
import subprocess
import os
import sys
from constants import CARLA_FPS

from stable_baselines3.common.vec_env.base_vec_env import tile_images

from carla_gym.utils import config_utils
from utils import saving_utils, server_utils
from agents.rl_birdview.utils.wandb_callback import WandbCallback

log = logging.getLogger(__name__)


def run_single(run_name, env, data_writer, driver_dict, driver_log_dir, log_video, remove_final_steps, pbar):
    list_debug_render = []
    list_data_render = []
    ep_stat_dict = {}
    ep_event_dict = {}

    for actor_id, driver in driver_dict.items():
        log_dir = driver_log_dir / actor_id
        log_dir.mkdir(parents=True, exist_ok=True)
        driver.reset(log_dir / f'{run_name}.log')

    obs = env.reset()
    timestamp = env.timestamp
    done = {'__all__': False}
    valid = True
    # pbar = tqdm(total=CARLA_FPS*2)
    while not done['__all__']:
        driver_control = {}
        driver_supervision = {}

        for actor_id, driver in driver_dict.items():
            driver_control[actor_id] = driver.run_step(obs[actor_id], timestamp)
            driver_supervision[actor_id] = driver.supervision_dict
            # control = carla.VehicleControl(throttle=1.0, steer=0.0, brake=0.0)
            # driver_control[actor_id] = control
            # driver_supervision[actor_id] = {'action': np.array([1.0, 0.0, 0.0]),
            #                                 'speed': obs[actor_id]['speed']['forward_speed']
            #                                 }

        new_obs, reward, done, info = env.step(driver_control)

        im_rgb = data_writer.write(timestamp=timestamp, obs=obs,
                                   supervision=driver_supervision, reward=reward, control_diff=None,
                                   weather=env.world.get_weather())

        obs = new_obs

        # debug_imgs = []
        for actor_id, driver in driver_dict.items():
            # if log_video:
            #     debug_imgs.append(driver.render(info[actor_id]['reward_debug'], info[actor_id]['terminal_debug']))
            if done[actor_id] and (actor_id not in ep_stat_dict):
                episode_stat = info[actor_id]['episode_stat']
                ep_stat_dict[actor_id] = episode_stat
                ep_event_dict[actor_id] = info[actor_id]['episode_event']

                valid = data_writer.close(
                    info[actor_id]['terminal_debug'],
                    remove_final_steps, None)
                log.info(f'Episode {run_name} done, valid={valid}')

        # if log_video:
        #     list_debug_render.append(tile_images(debug_imgs))
        #     list_data_render.append(im_rgb)
        timestamp = env.timestamp
        pbar.update(1)

    return valid, list_debug_render, list_data_render, ep_stat_dict, ep_event_dict, timestamp


@hydra.main(config_path='config', config_name='data_collect')
def main(cfg: DictConfig):
    # if cfg.host == 'localhost' and cfg.kill_running:
    #     server_utils.kill_carla(cfg.port)
    log.setLevel(getattr(logging, cfg.log_level.upper()))

    # start carla servers
    # server_manager = server_utils.CarlaServerManager(
    #     cfg.carla_sh_path, port=cfg.port, render_off_screen=cfg.render_off_screen)
    # server_manager.start()

    driver_dict = {}
    obs_configs = {}
    reward_configs = {}
    terminal_configs = {}
    for ev_id, ev_cfg in cfg.actors.items():
        # initiate driver agent
        cfg_driver = cfg.agent[ev_cfg.driver]
        OmegaConf.save(config=cfg_driver, f='config_driver.yaml')
        DriverAgentClass = config_utils.load_entry_point(cfg_driver.entry_point)
        driver_dict[ev_id] = DriverAgentClass('config_driver.yaml')
        obs_configs[ev_id] = driver_dict[ev_id].obs_configs
        # driver_dict[ev_id] = 'hero'
        # obs_configs[ev_id] = OmegaConf.to_container(cfg_driver.obs_configs)

        for k, v in OmegaConf.to_container(cfg.agent.my.obs_configs).items():
            if k not in obs_configs[ev_id]:
                obs_configs[ev_id][k] = v

        # get obs_configs from agent
        reward_configs[ev_id] = OmegaConf.to_container(ev_cfg.reward)
        terminal_configs[ev_id] = OmegaConf.to_container(ev_cfg.terminal)

    OmegaConf.save(config=obs_configs, f='obs_config.yaml')

    # check h5 birdview maps have been generated
    config_utils.check_h5_maps(cfg.test_suites, obs_configs, cfg.carla_sh_path)

    last_checkpoint_path = f'{cfg.work_dir}/port_{cfg.port}_checkpoint.txt'
    if cfg.resume and os.path.isfile(last_checkpoint_path):
        with open(last_checkpoint_path, 'r') as f:
            env_idx = int(f.read())
    else:
        env_idx = 0

    # resume task_idx from ep_stat_buffer_{env_idx}.json
    ep_state_buffer_json = f'{cfg.work_dir}/port_{cfg.port}_ep_stat_buffer_{env_idx}.json'
    if cfg.resume and os.path.isfile(ep_state_buffer_json):
        ep_stat_buffer = json.load(open(ep_state_buffer_json, 'r'))
        ckpt_task_idx = len(ep_stat_buffer['hero'])
    else:
        ckpt_task_idx = 0
        ep_stat_buffer = {}
        for actor_id in driver_dict.keys():
            ep_stat_buffer[actor_id] = []

    # resume clearml task
    cml_checkpoint_path = f'{cfg.work_dir}/port_{cfg.port}_cml_task_id.txt'
    if cfg.resume and os.path.isfile(cml_checkpoint_path):
        with open(cml_checkpoint_path, 'r') as f:
            cml_task_id = f.read()
    else:
        cml_task_id = False
    # env_idx = 0
    # ckpt_task_idx = 0

    log.info(f'Start from env_idx: {env_idx}, task_idx {ckpt_task_idx}')

    # make save directories
    dataset_root = Path(cfg.dataset_root)
    dataset_root.mkdir(parents=True, exist_ok=True)
    im_stack_idx = [-1]
    # cml_task_name = f'{dataset_root.name}'

    dataset_dir = Path(os.path.join(cfg.dataset_root, cfg.test_suites[env_idx]['env_configs']['carla_map']))
    dataset_dir.mkdir(parents=True, exist_ok=True)

    diags_dir = Path('diagnostics')
    driver_log_dir = Path('driver_log')
    video_dir = Path('videos')
    diags_dir.mkdir(parents=True, exist_ok=True)
    driver_log_dir.mkdir(parents=True, exist_ok=True)
    video_dir.mkdir(parents=True, exist_ok=True)

    # init wandb
    task = Task.init(project_name=cfg.cml_project, task_name=cfg.cml_task_name, task_type=cfg.cml_task_type,
                     tags=cfg.cml_tags, continue_last_task=cml_task_id)
    task.connect(cfg)
    cml_logger = task.get_logger()
    with open(cml_checkpoint_path, 'w') as f:
        f.write(task.task_id)

    # This is used in case we re-run the data_collect job after it has been interrupted for example.
    if env_idx >= len(cfg.test_suites):
        log.info(f'Finished! env_idx: {env_idx}, resave to wandb')
        # server_manager.stop()
        return

    env_setup = OmegaConf.to_container(cfg.test_suites[env_idx])

    env = gym.make(env_setup['env_id'], obs_configs=obs_configs, reward_configs=reward_configs,
                   terminal_configs=terminal_configs, host=cfg.host, port=cfg.port,
                   seed=cfg.seed, no_rendering=cfg.no_rendering, **env_setup['env_configs'])

    # main loop
    n_episodes_per_env = math.ceil(cfg.n_episodes / len(cfg.test_suites))

    for task_idx in range(ckpt_task_idx, n_episodes_per_env):
        idx_episode = task_idx + n_episodes_per_env * env_idx
        run_name = f'{idx_episode:04}'
        log.info(f"Start data collection env_idx {env_idx}, task_idx {task_idx}, run_name {run_name}")

        while True:
            pbar = tqdm(
                total=CARLA_FPS*cfg.run_time,
                desc=f"Env {env_idx:02} / {len(cfg.test_suites):02} - Task {task_idx:04} / {n_episodes_per_env:04}")
            env.set_task_idx(np.random.choice(env.num_tasks))

            run_info = {
                'is_expert': True,
                'weather': env.task['weather'],
                'town': cfg.test_suites[env_idx]['env_configs']['carla_map'],
                'n_vehicles': env.task['num_zombie_vehicles'],
                'n_walkers': env.task['num_zombie_walkers'],
                'route_id': env.task['route_id'],
                'env_id': cfg.test_suites[env_idx]['env_id'],

            }
            save_birdview_label = 'birdview_label' in obs_configs['hero']
            data_writer = saving_utils.DataWriter(dataset_dir / f'{run_name}', cfg.ev_id, im_stack_idx,
                                                  run_info=run_info,
                                                  save_birdview_label=save_birdview_label,
                                                  render_image=cfg.log_video)

            valid, list_debug_render, list_data_render, ep_stat_dict, ep_event_dict, timestamp = run_single(
                run_name, env, data_writer, driver_dict, driver_log_dir,
                cfg.log_video,
                cfg.remove_final_steps,
                pbar)

            if valid:
                break

        diags_json_path = (diags_dir / f'{run_name}.json').as_posix()
        with open(diags_json_path, 'w') as fd:
            json.dump(ep_event_dict, fd, indent=4, sort_keys=False)

        # save time
        cml_logger.report_table(
            title='time',
            series=run_name,
            iteration=idx_episode,
            table_plot=pd.DataFrame({'total_step': timestamp['step'],
                                     'fps': timestamp['step'] / timestamp['relative_wall_time']
                                     }, index=['time']))

        # save statistics
        # for actor_id, ep_stat in ep_stat_dict.items():
        #     ep_stat_buffer[actor_id].append(ep_stat)
        #     log_dict = {}
        #     for k, v in ep_stat.items():
        #         k_actor = f'{actor_id}/{k}'
        #         log_dict[k_actor] = v
        # wandb.log(log_dict, step=idx_episode)
        cml_logger.report_table(
            title='statistics', series=run_name, iteration=idx_episode, table_plot=pd.DataFrame(ep_stat_dict))

        with open(ep_state_buffer_json, 'w') as fd:
            json.dump(ep_stat_buffer, fd, indent=4, sort_keys=True)

        # clean up
        list_debug_render.clear()
        list_data_render.clear()
        ep_stat_dict = None
        ep_event_dict = None

        saving_utils.report_dataset_size(dataset_dir)
        dataset_size = subprocess.check_output(['du', '-sh', dataset_dir]).split()[0].decode('utf-8')
        log.warning(f'{dataset_dir}: dataset_size {dataset_size}')

    env.close()
    env = None
    # server_manager.stop()

    # log after all episodes are completed
    table_data = []
    ep_stat_keys = None
    for actor_id, list_ep_stat in json.load(open(ep_state_buffer_json, 'r')).items():
        avg_ep_stat = WandbCallback.get_avg_ep_stat(list_ep_stat)
        data = [actor_id, cfg.actors[actor_id].driver, env_idx, str(len(list_ep_stat))]
        if ep_stat_keys is None:
            ep_stat_keys = list(avg_ep_stat.keys())
        data += [f'{avg_ep_stat[k]:.4f}' for k in ep_stat_keys]
        table_data.append(data)

    table_columns = ['actor_id', 'driver', 'env_idx', 'n_episode'] + ep_stat_keys
    # wandb.log({'table/summary': wandb.Table(data=table_data, columns=table_columns)})
    cml_logger.report_table(title='table', series='summary', iteration=env_idx,
                            table_plot=pd.DataFrame(table_data, columns=table_columns))

    with open(last_checkpoint_path, 'w') as f:
        f.write(f'{env_idx + 1}')

    log.info(f"Finished data collection env_idx {env_idx}, {env_setup['env_id']}.")
    if env_idx + 1 == len(cfg.test_suites):
        log.info(f"Finished, {env_idx + 1}/{len(cfg.test_suites)}")
        return
    else:
        log.info(f"Not finished, {env_idx + 1}/{len(cfg.test_suites)}")
        sys.exit(1)


if __name__ == '__main__':
    main()