名称: 知识合成器 描述: 擅长从多个来源聚合、处理和合成信息,形成连贯见解。适用于构建知识图谱、本体论、RAG系统或跨文档提取见解。触发词包括“知识图谱”、“本体论”、“信息合成”、“GraphRAG”、“见解提取”、“跨文档分析”。
知识合成器
目的
提供从多个来源聚合信息并将其合成为结构化、可操作知识的专业知识。专注于本体构建、知识图谱设计和RAG与AI系统的见解提取。
使用场景
- 构建知识图谱或本体论
- 设计GraphRAG或混合检索系统
- 跨多个文档合成信息
- 从文本中提取实体和关系
- 创建结构化知识库
- 开发分类法和分类系统
- 实现语义搜索架构
- 有意义地连接不同数据源
快速开始
在以下情况下调用此技能:
- 构建知识图谱或本体论
- 设计具有图组件的RAG系统
- 从多个来源合成见解
- 从非结构化文本中提取结构化知识
- 创建分类法或分类方案
不要在以下情况下调用:
- 无需图需求的向量数据库设置 → 使用
/context-manager - 通用NLP任务(命名实体识别、分类) → 使用
/nlp-engineer - 数据库模式设计 → 使用
/database-administrator - 文档撰写 → 使用
/technical-writer
决策框架
是否需要知识结构?
├── 分层结构(分类法)
│ └── 树状结构,父子关系
├── 图结构(连接实体)
│ └── 节点 + 边,属性图
├── 混合结构(RAG + 图)
│ └── 向量嵌入 + 知识图谱
└── 扁平结构(简单检索)
└── 标准向量存储足够
核心工作流
1. 本体设计
- 确定领域范围和边界
- 定义核心实体类型(类)
- 映射实体间的关系
- 添加属性和约束
- 与领域专家验证
- 用示例文档化
2. 知识图谱构建
- 从源文档中提取实体
- 识别实体间的关系
- 规范化和去重实体
- 构建图结构(节点、边)
- 添加元数据和来源信息
- 创建查询接口
3. 见解合成
- 收集来源并建立来源记录
- 提取关键主张和事实
- 识别矛盾和一致之处
- 合成为连贯的叙述
- 引用来源以便追溯
- 突出置信度水平
最佳实践
- 为所有提取的知识维护来源记录
- 适用时使用已建立的本体标准(OWL、SKOS)
- 为演进而设计——本体随时间变化
- 用源上下文验证提取的关系
- 平衡粒度与可用性
- 为提取的事实包含置信度分数
反模式
| 反模式 | 问题 | 正确方法 |
|---|---|---|
| 无来源追踪 | 无法验证主张 | 为每个事实追踪来源 |
| 过度复杂的本体 | 难以维护和查询 | 从简单开始,根据需要演进 |
| 忽略矛盾 | 不一致的知识库 | 标记并解决冲突 |
| 静态模式 | 与新领域冲突 | 为可扩展性设计 |
| 盲目信任提取 | 幻觉关系 | 用置信度阈值验证 |