-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Labels
Description
构建离线特征库和在线特征库
- 离线特征支持模型离线训练
- 在线特征支持线上模型调用
- 目标是离线和在线统一存储、使用、和计算
- 规范特征定义框架、增加特征高级功能,比如标准数据管道、特征管理、效果评估、打分等
名词
- 在线计算
- 批量预处理 比如天级别特征 如:最近1个月的借贷统计
- 准实时预处理 小时、分钟级别
- 共享特征库
集中式特征管理,不同团队都可以离线、在线使用特征、在符合特征规范的情况下,也可以提交特征,支持给特征打标签,提供特征搜索快速查找符合某一类问题的最有效的特征。后续会提供数据到特征库的工具、特征库到模型的转换抽取工具或接口等等。。头脑风暴下..... - 特征分类
- 原始特征
- 衍生特征
- 枚举特征
- 动态特征
- 。。。
TODO : 理想的特征库是什么样子,,一张图
Reactions are currently unavailable