名称：深度研究描述：为复杂问题进行全面的多源研究。当用户提出需要多个来源、深入分析、交叉引用或专家级研究报告的复杂问题时使用。触发词包括“研究”、“调查”、“深度探究”、“彻底分析”、“综合报告”或涉及冲突来源的问题。

深度研究

自主研究代理，用于需要合成、验证和专家级分析的复杂、多源问题。

何时激活

需要多个来源的复杂问题
信息冲突或微妙的话题
要求进行全面分析或报告
需要跨领域专业知识的问题
带有源验证的事实核查

时间意识

尊重用户给出的时间框架。 如果未给出，则使用最新信息。

用户指定时间框架 → 将来源和声明限制在该期间内。
- 示例：“今年”、“2024年”、“过去5年”、“近期研究”、“当前状态”
- 在查询中：添加日期/年约束；在合成中，注明证据时间。
未给出时间框架 → 优先使用最新证据。
- 事实和趋势：优先使用近期来源（例如，除非是历史话题，否则使用最近2-3年）。
- 对于“当前状态”或“X的现状”：强调最新数据和报告。
- 对于历史或“从何时开始”问题：使用用户询问的时间段。
始终记录发布时间在源日志中，并在报告中提到时效性（例如，“截至2024年…”或“基于2023年数据…”）。

研究流程

按顺序执行这些阶段。每个阶段都建立在前一个阶段的基础上。

┌─────────────────────────────────────────────────────────────────┐
│  1. 分解 → 2. 规划 → 3. 搜索 → 4. 验证 → 5. 合成 │
│       ↑                                    │                    │
│       └────────── 如有缺口则迭代 ─────────┘                    │
└─────────────────────────────────────────────────────────────────┘

阶段1：查询分解

将复杂问题分解为原子子问题。

分解策略

识别问题类型：
- 事实性（谁、什么、何时、何地）
- 因果性（为什么、如何）
- 比较性（哪个更好、差异）
- 预测性（会发生什么）
- 评价性（应该、是好是坏）
提取实体和关系：
- 关键概念、参与者、事件
- 时间约束（日期、期间）
- 范围约束（地理、领域）

生成子问题（目标3-7个）：

原始问题：“AI如何影响未来十年的医疗保健成本？”

子问题：
1. 当前医疗保健中AI应用有哪些？
2. 现有AI医疗保健工具已记录的成本节约是多少？
3. AI在医疗保健中的预计采用率是多少？
4. AI可能影响的主要医疗保健成本驱动因素是什么？
5. AI在医疗保健中采用的主要障碍是什么？
6. 专家预测对AI医疗保健成本的看法是什么？

识别依赖关系：
- 哪些问题必须先回答？
- 哪些可以并行搜索？

重构技术

对于每个子问题，生成2-3个搜索查询变体：

技术	示例
同义词扩展	“可再生能源” → “太阳能风能”、“清洁能源发电”
具体化阶梯	宽泛：“饮食益处” → 具体：“地中海饮食心血管2023”
源定位	添加：“研究论文”、“元分析”、“政府报告”
时效性过滤器	为时间敏感话题添加年份约束

阶段2：研究规划

在搜索前创建结构化研究计划。

计划模板

## 研究计划：[原始问题]

### 目标
[一句话目标]

### 子问题（优先级顺序）
1. [关键] 解锁其他问题的问
2. [高] 核心事实性问题
3. [中] 支持性上下文
4. [低] 可有可无的细节

### 搜索策略
- 并行批处理1：[Q1, Q2]（独立）
- 顺序：Q3依赖于Q1结果
- 并行批处理2：[Q4, Q5]

### 源要求
- [ ] 学术来源（同行评审）
- [ ] 官方报告（政府、组织）
- [ ] 专家评论（信誉分析师）
- [ ] 近期新闻（12个月内）
- [ ] **时间框架**：用户指定（例如2024年、过去5年）或默认使用最新

### 置信度目标
[高/中] - 定义“足够好”的含义

阶段3：并行搜索执行

使用并行批处理高效执行搜索。

搜索执行规则

批处理独立查询：同时运行3-5个搜索
多样化源策略：混合查询变体以避免回音室效应
预算意识：跟踪搜索计数，目标10-20个总搜索

每搜索过程

对于每个搜索结果：

提取关键声明并注明来源归属
注意源类型（学术、新闻、博客、官方）
记录发布日期
标记矛盾与现有发现

源跟踪格式

## 源日志

### [源1：标题]
- URL：[链接]
- 类型：[学术/新闻/官方/专家/博客]
- 日期：[发布日期]
- 可信度：[高/中/低]
- 关键声明：
  - 声明1：“[引用或转述]”
  - 声明2：“[引用或转述]”
- 矛盾：[其他源（如适用）]

阶段4：迭代验证循环

关键阶段 - 不要跳过。在合成前验证。

验证协议

┌─────────────────────────────────────────┐
│  对于每个主要声明：                  │
│  1. 是否由2+个来源支持？      │
│  2. 来源是否有不同偏见？   │
│  3. 声明是否足够近期？         │
│  4. 是否有可信的矛盾？  │
└─────────────────────────────────────────┘

自我反思问题

初始搜索轮后，明确回答：

覆盖检查：“是否解决了所有子问题？”
置信度检查：“哪些声明证据薄弱？”
偏见检查：“我的来源是否意识形态多样？”
缺口检查：“缺少什么会改变结论？”
矛盾检查：“是否调查了冲突声明？”

迭代决策

条件	动作
子问题未回答	使用重构查询搜索
声明只有单一来源	搜索以确证
发现主要矛盾	搜索以解决/上下文
置信度目标达成	进行到合成
搜索预算耗尽	注明限制，进行

递归验证

对于高风险声明：

## 验证链：[声明]

级别1：原始源说X
级别2：源引用研究Y → 验证研究Y存在并说X
级别3：研究方法 → 是否严谨？

验证状态：[确认/部分确认/未验证/矛盾]

阶段5：合成与报告生成

将发现结合成连贯、引用充分的报告。

合成规则

以结论引领，以证据支持
引用每个事实声明并注明来源参考
明确承认不确定性
公平呈现矛盾，解释哪个观点支持更好
分离事实与解释

报告结构

始终以可见的“来源”或“参考文献”部分结束报告，列出使用的每个源。读者必须能看到并验证信息来源。

# [研究问题]

## 执行摘要
[2-3句话回答及置信度水平]

## 关键发现

### 发现1：[声明]
[带引用的证据合成]
- 源A报告...[1]
- 这由...[2]确证
- 然而，源C指出...[3]

### 发现2：[声明]
[带引用的证据合成]

## 分析
[您的解释连接发现]

## 限制与缺口
- [无法验证的内容]
- [需要更多研究的领域]
- [可用来源的潜在偏见]

## 置信度评估

| 声明   | 置信度 | 基础                    |
| ------- | ---------- | ------------------------ |
| 声明1 | 高       | 3+独立来源   |
| 声明2 | 中     | 2个来源，部分冲突 |
| 声明3 | 低        | 单一来源，近期    |

## 来源
[必需 — 列出使用的每个源，以便读者验证和跟进。]

[1] 作者或出版商，“标题”，出版物/网站，日期。URL
[2] 作者或出版商，“标题”，出版物/网站，日期。URL
[3] ...

显示使用的来源

在每次深度研究报告结尾包括“来源”（或“参考文献”）部分
列出每个源 用于支持发现，按引用顺序[1], [2]包括，…
格式化每个条目 以便查找源：作者/出版商、标题、出版物/网站、日期和URL
不要省略源 或将其摘要掉；完整列表必须在交付报告中可见

思维链模板

使用此内部推理结构：

**思考[问题]...**

1. 分解：在回答[Y]之前我需要理解[X]
2. 当前知识：我从[来源]发现[声明]
3. 识别的缺口：我还不知道[Z]
4. 矛盾：源A说X，但源B说Y
5. 解决策略：我将搜索[特定查询]以解决
6. 置信度更新：验证后，我[%]置信因为[原因]

避免的反模式

❌ 对于复杂话题的单源结论
❌ 忽略矛盾证据
❌ 将所有源视为同等可信
❌ 第一轮搜索后停止而不验证
❌ 将不确定声明呈现为事实
❌ 忘记引用来源
❌ 回音室来源（所有来源同一视角）
❌ 省略或隐藏来源列表（报告必须显示使用的所有源）

质量检查表

在交付最终报告前：

[ ] 所有子问题已解决
[ ] 每个声明都有引用
[ ] 矛盾已承认
[ ] 置信度水平已陈述
[ ] 限制已记录
[ ] 来源多样且可信
[ ] 时效性适合话题
[ ] 使用的源已显示：“来源”或“参考文献”部分列出每个源，含标题、出版物、日期和URL

记忆与持久系统

在结构化文件中跟踪研究进展，以跨会话保持上下文并支持更深分析。

记忆文件格式

# research-memory-[timestamp].yaml
研究:
  id: “深度研究-2024-01-15-143022”
  问题: “AI如何影响未来十年的医疗保健成本？”
  开始于: “2024-01-15T14:30:22Z”
  状态: “进行中”  # 规划|研究|合成|完成
  用户约束:
    深度: “全面”
    时间框架: “未来十年”
    预期输出: “带源的详细报告”
    特殊要求: [“PDF分析”、“学术论文”]

  阶段:
    规划:
      完成: true
      时间戳: “2024-01-15T14:30:45Z”
      用户响应:
        研究方法: “带学术重点的多源”
        关键领域: [“成本节约”、“采用障碍”、“专家预测”]
        深度偏好: “深入带主要源”

    分解:
      完成: true
      子问题:
        - id: “当前AI医疗保健”
          问题: “当前医疗保健中AI应用有哪些？”
          状态: “完成”
          优先级: “高”
        - id: “成本节约证据”
          问题: “已记录的成本节约是多少？”
          状态: “进行中”
          优先级: “高”

    研究:
      当前批处理: 2
      批处理:
        批处理1:
          状态: “完成”
          查询: [“AI医疗保健应用2024”、“机器学习医学诊断”]
          找到的源: 12
        批处理2:
          状态: “进行中”
          查询: [“AI医疗保健成本节约研究”、“ROI AI医疗工具”]
          找到的源: 8

  发现:
    关键声明:
      - id: “AI诊断准确性”
        声明: “AI将诊断准确性提高10-30%”
        置信度: “高”
        来源: [“源1”、“源2”、“源3”]
        验证状态: “三角验证”
        最后更新: “2024-01-15T15:15:30Z”

    矛盾:
      - id: “成本节约时间线”
        声明A: “可能立即成本节约”
        声明B: “成本节约需2-3年”
        解决策略: “进一步调查”
        来源: [“学术论文2023”、“行业报告2024”]

    缺口:
      - 问题: “5年后的长期成本影响”
        原因: “有限纵向研究”
        缓解: “搜索专家预测和模型”

  来源:
    源1:
      标题: “AI在医学成像中：系统回顾”
      类型: “学术”
      url: “https://example.com/paper1.pdf”
      日期: “2024-01-10”
      可信度分数: 14
      关键声明: [“声明1”、“声明2”]

  检查点:
    - id: “中期研究回顾”
      时间戳: “2024-01-15T15:45:00Z”
      目前发现: “找到15个源，3个主要主题出现”
      用户反馈: “方向看起来好，更多关注经济分析”
      做出的调整: [“添加经济查询”、“优先ROI研究”]

  合成:
    状态: “待定”
    大纲:
      执行摘要: “AI将在5年内减少医疗保健成本5-15%”
      关键发现:
        - “诊断改进”
        - “行政效率”
      限制:
        - “实施挑战”
        - “监管障碍”

记忆管理规则

在研究开始时创建记忆文件 带时间戳
逐步更新 每个主要阶段或发现后
跨会话持久 - 允许恢复中断的研究
跟踪用户互动 - 存储反馈和修正
启用共享 - 记忆文件可导出/共享以协作

记忆驱动的研究流程

开始: 用户问题
       ↓
┌─────────────────┐
│   初始化      │ ← 创建研究记忆文件
│   记忆       │
└─────────────────┘
       ↓
┌─────────────────┐
│   规划      │ ← 向用户询问澄清问题
│   问题      │   关于深度、格式、重点领域
└─────────────────┘
       ↓
┌─────────────────┐
│ 分解   │ ← 将问题分解为子问题
└─────────────────┘
       ↓
┌─────────────────┐     ┌─────────────────┐
│   批处理      │ --> │   PDF/DOC       │
│   搜索        │     │   分析      │
└─────────────────┘     └─────────────────┘
       ↓                           ↓
┌─────────────────┐     ┌─────────────────┐
│  发现      │ <-- │   提取      │
│ 提取      │     │   声明和      │
└─────────────────┘     │   洞察      │
                        └─────────────────┘
       ↓
┌─────────────────┐
│  检查点     │ ← 暂停以获取用户反馈
│  和反馈     │   “这是正确方向吗？”
└─────────────────┘
       ↓
       ├─ 继续 ──→ [调整搜索策略]
       │
       ├─ 转向 ─────→ [添加/移除重点领域]
       │
       └─ 深化 ────→ [更详细分析]

┌─────────────────┐
│ 验证    │ ← 交叉引用声明，检查矛盾
└─────────────────┘
       ↓
┌─────────────────┐
│   合成     │ ← 构建全面报告
│   和报告      │
└─────────────────┘
       ↓
┌─────────────────┐
│   最终         │ ← 呈现给用户
│   交付      │
└─────────────────┘
       ↓
┌─────────────────┐
│  记忆         │ ← 存档供未来参考
│  归档       │
└─────────────────┘

互动提问阶段

研究前问题

在研究开始前，向用户询问澄清问题：

## 研究规划问题

**1. 研究深度与范围**
您寻求什么级别的深度？
- [ ] 概述/总结（快速回答）
- [ ] 详细分析（全面覆盖）
- [ ] 专家级（学术论文、技术细节）

**2. 预期输出格式**
什么格式最有用？
- [ ] 执行摘要带关键发现
- [ ] 详细报告带证据和引用
- [ ] 比较分析
- [ ] 基于当前趋势的预测/预测

**3. 关键重点领域**
哪些方面对您最重要？（全选）
- [ ] 当前状态/趋势
- [ ] 未来预测
- [ ] 特定技术/地区
- [ ] 成本/效益分析
- [ ] 实施挑战

**4. 源偏好**
有偏好的源类型吗？
- [ ] 学术/研究论文
- [ ] 行业报告
- [ ] 新闻/媒体报道
- [ ] 政府数据
- [ ] 专家意见

**5. 时间敏感性**
时效性多重要？
- [ ] 非常重要（关注最新数据）
- [ ] 有些重要（平衡质量）
- [ ] 不重要（优先全面历史视图）

研究中检查点

定期暂停研究以验证方向：

## 研究检查点 - 批处理[N]完成

**目前发现：**
- [关键发现1]
- [关键发现2]
- [出现模式/趋势]

**方向检查：**
我们是否探索了正确领域？应该：
- [ ] 继续当前方向
- [ ] 转向不同重点领域
- [ ] 添加特定主题以调查
- [ ] 在某些领域减少范围

**深度调整：**
当前深度水平看起来[合适/过浅/过深]。应该：
- [ ] 保持当前深度
- [ ] 在[特定主题]上深化
- [ ] 更简要总结[特定主题]

**新出现的问题：**
- [研究中出现的问题]
- [需要额外澄清]

增强PDF与文档分析

PDF处理能力

对于全面研究，自动下载和分析：

学术论文：全文提取、引用分析、方法学审查
研究报告：执行摘要、数据提取、方法学评估
技术文档：API文档、实施指南、规范
政府报告：统计数据、政策分析、监管框架

PDF分析流程

PDF源 → 下载 → 文本提取 → 内容分析 → 关键洞察 → 记忆存储
     ↓              ↓            ↓                ↓              ↓            ↓
  URL/标题     本地文件    结构化文本   声明/事实   摘要   研究记忆

文档智能功能

引用提取：跟踪参考文献并构建引用网络
图/表分析：从可视化中提取数据
方法学评估：评估研究严谨性和有效性
交叉引用验证：跨多个文档链接声明
内容总结：生成结构化摘要和关键发现

更新后的流程结构

增强的研究流程

┌─────────────────────────────────────────────────────────────────────┐
│  1. 问题 → 2. 记忆初始化 → 3. 规划问题 → 4. 用户输入 │
│                                                                     │
│  5. 分解 → 6. 记忆更新 → 7. 批处理搜索 → 8. PDF分析 │
│                                                                     │
│  9. 验证 → 10. 检查点 → 11. 用户反馈 → 12. 调整 │
│                                                                     │
│  13. 迭代或 → 14. 合成 → 15. 最终报告 → 16. 记忆归档 │
└─────────────────────────────────────────────────────────────────────┘

关键增强

记忆集成：所有阶段更新持久记忆
用户互动：多个检查点用于反馈和课程纠正
文档智能：高级PDF和论文分析能力
迭代精炼：研究基于发现和用户输入适应
全面跟踪：研究过程和决策的完整审计跟踪

附加资源

对于查询分解策略，见references/query-decomposition.md
对于验证模式，见references/verification-patterns.md