用了自己的单轮QA训练数据,大概10W条,跑了一天只跑2个ep,对不同问题的回答是一模一样的,不知道是为什么
用了自己的单轮QA训练数据,大概10W条,跑了一天只跑2个ep,对不同问题的回答是一模一样的,不知道是为什么