研究综合工作流 research-synthesis-workflow

这个技能提供了一种系统的方法论,用于进行学术或行业研究,从多个来源搜集、分析和综合信息,生成可操作的见解和知识产物。关键词包括:研究综合、文献综述、信息提取、知识管理、工作流、方法论、源评估、综合方法。

文献检索 0 次安装 0 次浏览 更新于 3/7/2026

名称: 研究综合工作流 描述: 用于从多个来源搜集、分析和综合研究,形成连贯见解和可操作知识的系统方法论。 许可证: MIT

研究综合工作流

这个技能提供了一种系统的方法论,用于进行研究、从多个来源综合发现,并生成可操作的知识产物。

核心能力

  • 源评估: 评估可信度、相关性和偏见
  • 信息提取: 系统化的笔记和注释
  • 综合方法: 主题分析、元分析、框架构建
  • 知识产物: 报告、文献综述、决策框架

研究工作流概述

┌──────────────────────────────────────────────────────────────┐
│                    研究综合工作流                │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  1. 范围定义         2. 搜集源         3. 提取信息              │
│  ┌─────────┐      ┌─────────┐      ┌─────────┐              │
│  │ 定义    │─────▶│ 寻找    │─────▶│ 捕获    │              │
│  │ 问题    │      │ 源      │      │ 见解    │              │
│  └─────────┘      └─────────┘      └─────────┘              │
│       │                                  │                   │
│       │          5. 生产物         4. 综合              │
│       │          ┌─────────┐      ┌─────────┐              │
│       └─────────▶│ 创建    │◀─────│ 连接    │              │
│                  │ 产物    │      │ 主题    │              │
│                  └─────────┘      └─────────┘              │
│                                                              │
└──────────────────────────────────────────────────────────────┘

阶段 1: 范围定义

研究问题框架

将模糊主题转化为可回答的问题:

类型 模式 示例
探索性 什么是 X? X 如何工作? 什么是向量搜索?
比较性 X 与 Y 相比如何? PostgreSQL 与 Neo4j 用于图数据库?
评估性 X 对 Y 有效吗? RAG 对技术文档有效吗?
因果性 什么导致 X? X 的影响是什么? 什么导致 LLM 幻觉?
规定性 我们应如何实现 X? 如何设计 RAG 管道?

范围边界

明确定义:

  • 在范围内: 要涵盖的主题
  • 在范围外: 要排除的相邻主题
  • 深度: 调查(广泛) vs 深入(狭窄)
  • 时间界限: 源的截止日期
  • 源类型: 学术、行业、原始数据

示例范围文档

## 研究范围: 向量数据库选择

### 研究问题
哪个向量数据库最适合我们的生产 RAG 系统,要求 <50ms 延迟和 1000 万+向量?

### 在范围内
- Pinecone, Weaviate, Milvus, Qdrant, pgvector
- 规模延迟基准
- 成本分析(云 vs 自托管)
- 操作复杂性

### 在范围外
- 带有向量扩展的通用数据库
- 少于百万向量的用例
- 仅学术/研究系统

### 成功标准
推荐 2-3 个顶级候选者并提供支持证据

阶段 2: 源搜集

源质量评估

评估每个源:

标准 高质量 低质量
权威性 专家作者,同行评审 匿名,无证书
时效性 近期,更新 过时,无日期
准确性 引用,可验证 无支持的主张
目的 告知,教育 销售,说服
覆盖范围 全面 肤浅

源类型和用途

主要源(原始)
├── 研究论文
├── 官方文档
├── 基准数据
└── 专家访谈

次要源(分析)
├── 评论文章
├── 技术博客
├── 行业报告
└── 书章节

三级源(摘要)
├── 维基百科
├── 教科书
└── 百科全书

搜索策略

关键词扩展:

  • 起始: “向量数据库性能”
  • 扩展: “近似最近邻”, “HNSW 基准”, “嵌入搜索延迟”

引用链:

  • 向前: 谁引用这篇论文?
  • 向后: 这篇论文引用什么?

作者跟踪:

  • 找到关键研究人员,跟踪他们的工作

源文档化

对于每个源,捕获:

## 源: [标题]
- **URL/DOI**:
- **作者**:
- **日期**:
- **类型**: [论文/博客/文档/报告]
- **质量分数**: [1-5]
- **相关性**: [高/中/低]
- **关键主题**:
- **笔记**:

阶段 3: 信息提取

结构化笔记

使用一致的模板进行提取:

## 主张: [具体断言]
- **源**: [引用]
- **证据**: [支持数据/推理]
- **强度**: [强/中/弱]
- **我的评估**: [同意/不同意/不确定]
- **相关主张**: [链接到其他笔记]

证据分类

类型 描述 权重
经验性 测量数据,实验
分析性 逻辑推导 中-高
轶事性 案例研究,示例
专家意见 权威声明
理论性 模型预测 中-低

矛盾跟踪

当源不一致时:

## 冲突: [主题]

### 位置 A: [主张]
- 源: [列表]
- 证据: [摘要]

### 位置 B: [主张]
- 源: [列表]
- 证据: [摘要]

### 分析
- 方法学差异:
- 上下文差异:
- 可能解决方案:
- 我的结论:

阶段 4: 综合

主题分析

  1. 编码 个体见解带标签
  2. 聚类 相关编码成主题
  3. 审查 主题的一致性
  4. 定义 每个主题清晰
  5. 关联 主题到研究问题
编码                    主题                 发现
├─ 快速查询     ─┐
├─ 低延迟      ─┼── 性能      ─┬── 主题 1: 性能
├─ 高吞吐量  ─┘                     │   因工作负载类型显著变化
├─ 管理服务  ─┐                     │
├─ 自托管      ─┼── 部署      ─┼── 主题 2: 云 vs
├─ Kubernetes  ─┘                     │   自托管权衡
├─ 定价层      ─┐                     │
├─ 计算成本    ─┼── 经济学      ─┴── 主题 3: 总成本
├─ 隐藏成本     ─┘                       驱动最终选择

框架构建

从综合创建决策框架:

## 向量数据库选择框架

### 决策树
1. 规模要求?
   - <100 万向量 → pgvector(简单性)
   - 100 万-1 亿向量 → 继续到 2
   - >1 亿向量 → Milvus/Weaviate(分布式)

2. 操作能力?
   - 有限 DevOps → Pinecone(托管)
   - 强大 DevOps → 继续到 3

3. 成本敏感度?
   - 预算有限 → Qdrant(开源)
   - 预算灵活 → 评估所有选项

### 比较矩阵
| 标准      | 权重 | Pinecone | Milvus | Qdrant |
|----------------|--------|----------|--------|--------|
| 延迟        | 30%    | 4        | 5      | 4      |
| 可扩展性    | 25%    | 5        | 5      | 4      |
| 操作      | 20%    | 5        | 3      | 4      |
| 成本           | 15%    | 2        | 4      | 5      |
| 功能       | 10%    | 4        | 5      | 4      |
| **加权**   |        | **4.0**  | **4.4**| **4.2**|

阶段 5: 知识产物生产

产物类型

格式 目的 受众
执行摘要 快速决策支持 领导层
技术报告 详细分析 工程师
文献综述 学术综合 研究人员
决策框架 结构化评估 决策者
参考指南 快速查找 实践者

结构模板

执行摘要 (1-2 页):

  1. 上下文和问题
  2. 关键发现 (3-5 点)
  3. 推荐
  4. 风险和考虑

技术报告 (5-20 页):

  1. 执行摘要
  2. 背景和范围
  3. 方法论
  4. 按主题的发现
  5. 分析和讨论
  6. 推荐
  7. 附录(数据,源)

质量检查清单

最终前:

  • [ ] 研究问题回答了吗?
  • [ ] 所有主张有证据支持吗?
  • [ ] 矛盾处理了吗?
  • [ ] 局限性承认了吗?
  • [ ] 有可操作推荐吗?
  • [ ] 源正确引用了吗?
  • [ ] 适合受众吗?

最佳实践

避免偏见

  • 积极寻找反驳证据
  • 包括多个视角
  • 注意你的先验并更新它们
  • 分离观察和解释
  • 文档方法论以确保透明性

管理范围蔓延

  • 频繁回到研究问题
  • 将有趣的切线放入“未来研究”
  • 为每个阶段时间限制
  • 提前定义“足够好”标准

迭代

研究很少是线性的:

  • 新源可能需要范围调整
  • 综合可能揭示需要更多搜集的缺口
  • 产物可能需要多稿

参考

  • references/evaluation-rubrics.md - 源质量评分指南
  • references/synthesis-methods.md - 详细综合技术
  • references/artifact-templates.md - 文档模板和示例