名称:特征工程优化器 描述:优化特征工程流水线和特征存储配置 版本:1.0.0 类别:机器学习工程 技能ID:SK-DEA-015 允许使用的工具:
- 读取
- 写入
- 编辑
- 全局搜索
- 文本搜索
- Bash
特征工程优化器
概述
优化特征工程流水线和特征存储配置。此技能提升机器学习特征的质量、性能和在线服务效率。
核心能力
- 特征重要性分析
- 特征相关性检测
- 编码策略推荐
- 特征新鲜度优化
- 在线/离线特征同步
- 特征版本管理
- 时间点正确性验证
- 特征服务优化
输入模式
{
"特征": [{
"名称": "字符串",
"定义": "字符串",
"类型": "字符串"
}],
"目标变量": "字符串",
"使用场景": ["批量|实时|流式"],
"性能要求": "对象"
}
输出模式
{
"优化后的特征": ["对象"],
"移除的特征": ["字符串"],
"工程化建议": ["对象"],
"服务配置": "对象"
}
目标流程
- 特征存储设置
- A/B测试流水线
使用指南
- 提供完整的特征定义
- 指定用于重要性分析的目标变量
- 定义使用场景(批量、实时、流式)
- 包含用于服务优化的性能要求
最佳实践
- 验证训练特征的时间点正确性
- 移除高度相关的特征以减少冗余
- 根据实际需求优化特征新鲜度
- 特征版本与模型版本同步管理
- 监控生产环境中的特征漂移