Skip to content

概述 #8

@smallbaby

Description

@smallbaby

构建离线特征库和在线特征库

  • 离线特征支持模型离线训练
  • 在线特征支持线上模型调用
  • 目标是离线和在线统一存储、使用、和计算
  • 规范特征定义框架、增加特征高级功能,比如标准数据管道、特征管理、效果评估、打分等

名词

  • 在线计算
    • 批量预处理 比如天级别特征 如:最近1个月的借贷统计
    • 准实时预处理 小时、分钟级别
  • 共享特征库
    集中式特征管理,不同团队都可以离线、在线使用特征、在符合特征规范的情况下,也可以提交特征,支持给特征打标签,提供特征搜索快速查找符合某一类问题的最有效的特征。后续会提供数据到特征库的工具、特征库到模型的转换抽取工具或接口等等。。头脑风暴下.....
  • 特征分类
    • 原始特征
    • 衍生特征
    • 枚举特征
    • 动态特征
    • 。。。

TODO : 理想的特征库是什么样子,,一张图

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions