研究合成工作流程 research-synthesis-workflow

这是一个系统性研究合成技能,用于从多个来源收集信息、分析数据、合成见解并生成可操作的知识工件。关键词包括研究合成、信息提取、知识管理、文献分析、方法论。

文献检索 0 次安装 1 次浏览 更新于 3/7/2026

name: 研究合成工作流程 description: 用于从多个来源收集、分析和综合研究以形成连贯见解和可操作知识的系统性方法。 license: MIT

研究合成工作流程

本技能提供了一种系统性方法,用于进行研究、综合多个来源的发现并生产可操作的知识工件。

核心能力

  • 来源评估:评估可信度、相关性和偏见
  • 信息提取:系统性笔记记录和注释
  • 合成方法:主题分析、元分析、框架构建
  • 知识工件:报告、文献综述、决策框架

研究工作流程概述

┌──────────────────────────────────────────────────────────────┐
│                    研究合成工作流程                         │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  1. 范围定义     2. 收集来源     3. 信息提取               │
│  ┌─────────┐      ┌─────────┐      ┌─────────┐              │
│  │ 定义    │─────▶│ 寻找    │─────▶│ 捕获    │              │
│  │ 问题    │      │ 来源    │      │ 见解    │              │
│  └─────────┘      └─────────┘      └─────────┘              │
│       │                                  │                   │
│       │          5. 生产工件     4. 合成                   │
│       │          ┌─────────┐      ┌─────────┐              │
│       └─────────▶│ 创建    │◀─────│ 连接    │              │
│                  │ 工件    │      │ 主题    │              │
│                  └─────────┘      └─────────┘              │
│                                                              │
└──────────────────────────────────────────────────────────────┘

阶段 1:范围定义

研究问题框架

将模糊主题转化为可回答的问题:

类型 模式 示例
探索性 什么是 X?X 如何工作? 什么是向量搜索?
比较性 X 与 Y 如何比较? PostgreSQL 与 Neo4j 用于图形?
评估性 X 对 Y 有效吗? RAG 对技术文档有效吗?
因果性 什么导致 X?X 的效果是什么? 什么导致 LLM 幻觉?
规范性 如何实施 X? 如何设计 RAG 管道?

范围边界

明确定义:

  • 范围内:涵盖的主题
  • 范围外:排除的相邻主题
  • 深度:调查(广泛)vs 深入(狭窄)
  • 时间界限:来源的截止日期
  • 来源类型:学术、行业、原始数据

示例范围文档

## 研究范围:向量数据库选择

### 研究问题
哪种向量数据库最适合我们的生产 RAG 系统,要求在 1000 万+ 向量下延迟 <50ms?

### 范围内
- Pinecone、Weaviate、Milvus、Qdrant、pgvector
- 规模下的延迟基准测试
- 成本分析(云 vs 自托管)
- 操作复杂性

### 范围外
- 具有向量扩展的通用数据库
- 少于百万向量的用例
- 仅学术/研究的系统

### 成功标准
基于支持证据,推荐 2-3 个顶级候选者

阶段 2:来源收集

来源质量评估

评估每个来源:

标准 高质量 低质量
权威性 专家作者,同行评审 匿名,无资质
时效性 最新,更新 过时,无日期
准确性 引用,可验证 无支持声明
目的 告知,教育 销售,说服
覆盖范围 全面 肤浅

来源类型和用途

原始来源(原创)
├── 研究论文
├── 官方文档
├── 基准数据
└── 专家访谈

二次来源(分析)
├── 综述文章
├── 技术博客
├── 行业报告
└── 书籍章节

三次来源(摘要)
├── 维基百科
├── 教科书
└── 百科全书

搜索策略

关键词扩展

  • 起始:“向量数据库性能”
  • 扩展:“近似最近邻”、“HNSW 基准测试”、“嵌入搜索延迟”

引用链

  • 前向:谁引用了这篇论文?
  • 后向:这篇论文引用了什么?

作者追踪

  • 找到关键研究人员,跟随他们的工作

来源文档化

对于每个来源,捕获:

## 来源:[标题]
- **URL/DOI**:
- **作者**:
- **日期**:
- **类型**:[论文/博客/文档/报告]
- **质量分数**:[1-5]
- **相关性**:[高/中/低]
- **关键主题**:
- **笔记**:

阶段 3:信息提取

结构化笔记记录

使用一致的模板进行提取:

## 主张:[具体断言]
- **来源**:[引用]
- **证据**:[支持数据/推理]
- **强度**:[强/中/弱]
- **我的评估**:[同意/不同意/不确定]
- **相关主张**:[链接到其他笔记]

证据分类

类型 描述 权重
经验性 测量数据,实验
分析性 逻辑推导 中-高
轶事性 案例研究,例子
专家意见 权威声明
理论性 模型预测 中-低

矛盾追踪

当来源不同意时:

## 冲突:[主题]

### 立场 A:[主张]
- 来源:[列表]
- 证据:[摘要]

### 立场 B:[主张]
- 来源:[列表]
- 证据:[摘要]

### 分析
- 方法差异:
- 上下文差异:
- 可能的解决方案:
- 我的结论:

阶段 4:合成

主题分析

  1. 编码 个别见解与标签
  2. 聚类 相关代码到主题
  3. 审查 主题的连贯性
  4. 定义 每个主题清晰
  5. 关联 主题到研究问题
代码                    主题                 发现
├─ 快速查询       ─┐
├─ 低延迟        ─┼── 性能         ─┬── 主题 1:性能
├─ 高吞吐量       ─┘                     │   因工作负载类型而异
├─ 托管服务       ─┐                     │
├─ 自托管         ─┼── 部署         ─┼── 主题 2:云 vs
├─ Kubernetes      ─┘                     │   自托管的权衡
├─ 定价层         ─┐                     │
├─ 计算成本       ─┼── 经济学       ─┴── 主题 3:总成本
├─ 隐藏成本       ─┘                         驱动最终选择

框架构建

从合成创建决策框架:

## 向量数据库选择框架

### 决策树
1. 规模要求?
   - <100 万向量 → pgvector(简单性)
   - 100 万-1 亿向量 → 继续到 2
   - >1 亿向量 → Milvus/Weaviate(分布式)

2. 操作能力?
   - DevOps 有限 → Pinecone(托管)
   - DevOps 强 → 继续到 3

3. 成本敏感性?
   - 预算受限 → Qdrant(开源)
   - 预算灵活 → 评估所有选项

### 比较矩阵
| 标准        | 权重 | Pinecone | Milvus | Qdrant |
|-------------|------|----------|--------|--------|
| 延迟        | 30%  | 4        | 5      | 4      |
| 可扩展性    | 25%  | 5        | 5      | 4      |
| 操作        | 20%  | 5        | 3      | 4      |
| 成本        | 15%  | 2        | 4      | 5      |
| 功能        | 10%  | 4        | 5      | 4      |
| **加权**    |      | **4.0**  | **4.4**| **4.2**|

阶段 5:知识工件生产

工件类型

格式 目的 受众
执行摘要 快速决策支持 领导层
技术报告 详细分析 工程师
文献综述 学术合成 研究人员
决策框架 结构化评估 决策者
参考指南 快速查找 从业者

结构模板

执行摘要(1-2 页):

  1. 背景和问题
  2. 关键发现(3-5 个要点)
  3. 建议
  4. 风险和考虑

技术报告(5-20 页):

  1. 执行摘要
  2. 背景和范围
  3. 方法
  4. 按主题的发现
  5. 分析和讨论
  6. 建议
  7. 附录(数据、来源)

质量检查清单

在最终确定前:

  • [ ] 研究问题是否已回答?
  • [ ] 所有主张是否有证据支持?
  • [ ] 矛盾是否已解决?
  • [ ] 局限性是否已承认?
  • [ ] 是否有可操作的建议?
  • [ ] 来源是否正确引用?
  • [ ] 是否适合受众?

最佳实践

避免偏见

  • 主动寻找反驳证据
  • 包括多个视角
  • 注意你的先验并更新它们
  • 分离观察和解释
  • 记录方法以提高透明度

管理范围蔓延

  • 频繁返回研究问题
  • 将有趣的分支放入“未来研究”
  • 为每个阶段计时
  • 提前定义“足够好”的标准

迭代

研究很少是线性的:

  • 新来源可能需要范围调整
  • 合成可能揭示需要更多收集的缺口
  • 工件可能需要多个草稿

参考资料

  • references/evaluation-rubrics.md - 来源质量评分指南
  • references/synthesis-methods.md - 详细合成技术
  • references/artifact-templates.md - 文档模板和示例