Skip to content

有关训练 T.D 的一些疑问 #21

@lym0302

Description

@lym0302

您好,想请教一下关于训练 T.D 的一些问题。论文中提到用AVSync15 数据集来训练T.D, 这个数据没有时间戳信息,只有分类和视频(命名类似于:6wHFhrAqt5Q_000023_000033_5.5_8.5.mp4), 请问怎么用来训练 timestamp detector,按道理训练数据应该有目标时间标记(音频每一帧是 1(有声) 还是0(无声) 的标记),这个时间标记怎么获取?

个人推测例如视频名称为: 6wHFhrAqt5Q_000023_000033_5.5_8.5.mp4, 则首先对应 训练数据是 vggsound 数据中的 6wHFhrAqt5Q_000023.mp4, 然后时间标记为1 的是 6wHFhrAqt5Q_000023.mp4中的 5.5~8.5, 其余的时间段的目标时间标记为0,是这样的吗?

请大佬们指教,感激不尽~~~

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions