name: spacy-ner description: 用于对话式AI的spaCy命名实体识别模型训练与实体抽取 allowed-tools:
- 读取
- 写入
- 编辑
- Bash
- Glob
- Grep
spaCy NER技能
能力
- 训练自定义spaCy NER模型
- 配置实体抽取流水线
- 设计标注方案
- 实现实体链接
- 设置模型评估
- 部署高效NER推理
目标流程
- 实体抽取-槽位填充
- 聊天机器人设计与实现
实现细节
spaCy组件
- NER: 命名实体识别
- EntityLinker: 链接到知识库
- EntityRuler: 基于规则的匹配
- SpanCategorizer: 重叠实体分类
训练配置
- config.cfg设置
- 训练数据格式(spaCy v3)
- 数据增强策略
- 评估指标
配置选项
- 基础模型选择(en_core_web_*)
- 自定义实体类型
- 训练参数
- GPU加速
- 模型打包
最佳实践
- 高质量标注数据
- 平衡实体类型分布
- 使用prodigy进行标注
- 定期模型评估
依赖项
- spacy
- spacy-transformers(可选)