v1.2.0
v1.2.0
- 完成第二阶段重构:解耦向量存储:
- 定义了
VectorStoreBase抽象基类,统一了向量存储接口。 - 实现了
FaissStore,将 FAISS 逻辑封装其中。 - 创建了
VectorStoreFactory,实现了向量存储的动态加载。
- 定义了
- 完成第三阶段重构:构建文档处理流水线:
- 创建了
etl模块,并为extractors,cleaners,splitters定义了抽象基类。 - 实现了针对 Markdown 的抽取器、基础文本清洗器和递归文本分割器。
- 创建了
PipelineManager,实现了数据处理的动态组合。
- 创建了
- 完成第四阶段重构:提升健壮性与开发者体验:
- 为核心模块(如模型提供商工厂、向量存储工厂、ETL流水线)编写了全面的单元测试。
- 优化了日志记录,并完善了项目文档。