#关联项目:书生第四期训练营 https://github.com/InternLM/Tutorial
#背景 大语言模型研究领域正在越来越多的吸引大量研究者参与其中,每天都有大量的文章进行发表。对于llm领域的从业人员或者对此发展前沿感兴趣的其他人员,对这些研究进行跟进并找到其中有价值的文章展开分析和实验,对于自己的理解和工作有巨大的帮助,尽管这要耗费大量的时间和精力,而这又往往是这部分人群所欠缺的。 基于此,准备设计并训练一个agent,帮助对每日的新发文章进行主要内容的总结、筛选和分类,并保留文章连接,提升信息分发效率,帮助研究者以更快、更敏捷的方式来获取与自己关心领域更相关的文章。
#数据来源
##原始数据
- arxiv
- huggingface
##训练数据/精调数据
自建
#agent数据处理链路
设计中