名称:深度研究 描述:为复杂问题进行全面的多源研究。当用户提出需要多个来源、深入分析、交叉引用或专家级研究报告的复杂问题时使用。触发词包括“研究”、“调查”、“深度探究”、“彻底分析”、“综合报告”或涉及冲突来源的问题。
深度研究
自主研究代理,用于需要合成、验证和专家级分析的复杂、多源问题。
何时激活
- 需要多个来源的复杂问题
- 信息冲突或微妙的话题
- 要求进行全面分析或报告
- 需要跨领域专业知识的问题
- 带有源验证的事实核查
时间意识
尊重用户给出的时间框架。 如果未给出,则使用最新信息。
- 用户指定时间框架 → 将来源和声明限制在该期间内。
- 示例:“今年”、“2024年”、“过去5年”、“近期研究”、“当前状态”
- 在查询中:添加日期/年约束;在合成中,注明证据时间。
- 未给出时间框架 → 优先使用最新证据。
- 事实和趋势:优先使用近期来源(例如,除非是历史话题,否则使用最近2-3年)。
- 对于“当前状态”或“X的现状”:强调最新数据和报告。
- 对于历史或“从何时开始”问题:使用用户询问的时间段。
- 始终记录发布时间在源日志中,并在报告中提到时效性(例如,“截至2024年…”或“基于2023年数据…”)。
研究流程
按顺序执行这些阶段。每个阶段都建立在前一个阶段的基础上。
┌─────────────────────────────────────────────────────────────────┐
│ 1. 分解 → 2. 规划 → 3. 搜索 → 4. 验证 → 5. 合成 │
│ ↑ │ │
│ └────────── 如有缺口则迭代 ─────────┘ │
└─────────────────────────────────────────────────────────────────┘
阶段1:查询分解
将复杂问题分解为原子子问题。
分解策略
-
识别问题类型:
- 事实性(谁、什么、何时、何地)
- 因果性(为什么、如何)
- 比较性(哪个更好、差异)
- 预测性(会发生什么)
- 评价性(应该、是好是坏)
-
提取实体和关系:
- 关键概念、参与者、事件
- 时间约束(日期、期间)
- 范围约束(地理、领域)
-
生成子问题(目标3-7个):
原始问题:“AI如何影响未来十年的医疗保健成本?” 子问题: 1. 当前医疗保健中AI应用有哪些? 2. 现有AI医疗保健工具已记录的成本节约是多少? 3. AI在医疗保健中的预计采用率是多少? 4. AI可能影响的主要医疗保健成本驱动因素是什么? 5. AI在医疗保健中采用的主要障碍是什么? 6. 专家预测对AI医疗保健成本的看法是什么? -
识别依赖关系:
- 哪些问题必须先回答?
- 哪些可以并行搜索?
重构技术
对于每个子问题,生成2-3个搜索查询变体:
| 技术 | 示例 |
|---|---|
| 同义词扩展 | “可再生能源” → “太阳能风能”、“清洁能源发电” |
| 具体化阶梯 | 宽泛:“饮食益处” → 具体:“地中海饮食心血管2023” |
| 源定位 | 添加:“研究论文”、“元分析”、“政府报告” |
| 时效性过滤器 | 为时间敏感话题添加年份约束 |
阶段2:研究规划
在搜索前创建结构化研究计划。
计划模板
## 研究计划:[原始问题]
### 目标
[一句话目标]
### 子问题(优先级顺序)
1. [关键] 解锁其他问题的问
2. [高] 核心事实性问题
3. [中] 支持性上下文
4. [低] 可有可无的细节
### 搜索策略
- 并行批处理1:[Q1, Q2](独立)
- 顺序:Q3依赖于Q1结果
- 并行批处理2:[Q4, Q5]
### 源要求
- [ ] 学术来源(同行评审)
- [ ] 官方报告(政府、组织)
- [ ] 专家评论(信誉分析师)
- [ ] 近期新闻(12个月内)
- [ ] **时间框架**:用户指定(例如2024年、过去5年)或默认使用最新
### 置信度目标
[高/中] - 定义“足够好”的含义
阶段3:并行搜索执行
使用并行批处理高效执行搜索。
搜索执行规则
- 批处理独立查询:同时运行3-5个搜索
- 多样化源策略:混合查询变体以避免回音室效应
- 预算意识:跟踪搜索计数,目标10-20个总搜索
每搜索过程
对于每个搜索结果:
- 提取关键声明并注明来源归属
- 注意源类型(学术、新闻、博客、官方)
- 记录发布日期
- 标记矛盾与现有发现
源跟踪格式
## 源日志
### [源1:标题]
- URL:[链接]
- 类型:[学术/新闻/官方/专家/博客]
- 日期:[发布日期]
- 可信度:[高/中/低]
- 关键声明:
- 声明1:“[引用或转述]”
- 声明2:“[引用或转述]”
- 矛盾:[其他源(如适用)]
阶段4:迭代验证循环
关键阶段 - 不要跳过。在合成前验证。
验证协议
┌─────────────────────────────────────────┐
│ 对于每个主要声明: │
│ 1. 是否由2+个来源支持? │
│ 2. 来源是否有不同偏见? │
│ 3. 声明是否足够近期? │
│ 4. 是否有可信的矛盾? │
└─────────────────────────────────────────┘
自我反思问题
初始搜索轮后,明确回答:
- 覆盖检查:“是否解决了所有子问题?”
- 置信度检查:“哪些声明证据薄弱?”
- 偏见检查:“我的来源是否意识形态多样?”
- 缺口检查:“缺少什么会改变结论?”
- 矛盾检查:“是否调查了冲突声明?”
迭代决策
| 条件 | 动作 |
|---|---|
| 子问题未回答 | 使用重构查询搜索 |
| 声明只有单一来源 | 搜索以确证 |
| 发现主要矛盾 | 搜索以解决/上下文 |
| 置信度目标达成 | 进行到合成 |
| 搜索预算耗尽 | 注明限制,进行 |
递归验证
对于高风险声明:
## 验证链:[声明]
级别1:原始源说X
级别2:源引用研究Y → 验证研究Y存在并说X
级别3:研究方法 → 是否严谨?
验证状态:[确认/部分确认/未验证/矛盾]
阶段5:合成与报告生成
将发现结合成连贯、引用充分的报告。
合成规则
- 以结论引领,以证据支持
- 引用每个事实声明并注明来源参考
- 明确承认不确定性
- 公平呈现矛盾,解释哪个观点支持更好
- 分离事实与解释
报告结构
始终以可见的“来源”或“参考文献”部分结束报告,列出使用的每个源。读者必须能看到并验证信息来源。
# [研究问题]
## 执行摘要
[2-3句话回答及置信度水平]
## 关键发现
### 发现1:[声明]
[带引用的证据合成]
- 源A报告...[1]
- 这由...[2]确证
- 然而,源C指出...[3]
### 发现2:[声明]
[带引用的证据合成]
## 分析
[您的解释连接发现]
## 限制与缺口
- [无法验证的内容]
- [需要更多研究的领域]
- [可用来源的潜在偏见]
## 置信度评估
| 声明 | 置信度 | 基础 |
| ------- | ---------- | ------------------------ |
| 声明1 | 高 | 3+独立来源 |
| 声明2 | 中 | 2个来源,部分冲突 |
| 声明3 | 低 | 单一来源,近期 |
## 来源
[必需 — 列出使用的每个源,以便读者验证和跟进。]
[1] 作者或出版商,“标题”,出版物/网站,日期。URL
[2] 作者或出版商,“标题”,出版物/网站,日期。URL
[3] ...
显示使用的来源
- 在每次深度研究报告结尾包括“来源”(或“参考文献”)部分
- 列出每个源 用于支持发现,按引用顺序[1], [2]包括,…
- 格式化每个条目 以便查找源:作者/出版商、标题、出版物/网站、日期和URL
- 不要省略源 或将其摘要掉;完整列表必须在交付报告中可见
思维链模板
使用此内部推理结构:
**思考[问题]...**
1. 分解:在回答[Y]之前我需要理解[X]
2. 当前知识:我从[来源]发现[声明]
3. 识别的缺口:我还不知道[Z]
4. 矛盾:源A说X,但源B说Y
5. 解决策略:我将搜索[特定查询]以解决
6. 置信度更新:验证后,我[%]置信因为[原因]
避免的反模式
- ❌ 对于复杂话题的单源结论
- ❌ 忽略矛盾证据
- ❌ 将所有源视为同等可信
- ❌ 第一轮搜索后停止而不验证
- ❌ 将不确定声明呈现为事实
- ❌ 忘记引用来源
- ❌ 回音室来源(所有来源同一视角)
- ❌ 省略或隐藏来源列表(报告必须显示使用的所有源)
质量检查表
在交付最终报告前:
- [ ] 所有子问题已解决
- [ ] 每个声明都有引用
- [ ] 矛盾已承认
- [ ] 置信度水平已陈述
- [ ] 限制已记录
- [ ] 来源多样且可信
- [ ] 时效性适合话题
- [ ] 使用的源已显示:“来源”或“参考文献”部分列出每个源,含标题、出版物、日期和URL
记忆与持久系统
在结构化文件中跟踪研究进展,以跨会话保持上下文并支持更深分析。
记忆文件格式
# research-memory-[timestamp].yaml
研究:
id: “深度研究-2024-01-15-143022”
问题: “AI如何影响未来十年的医疗保健成本?”
开始于: “2024-01-15T14:30:22Z”
状态: “进行中” # 规划|研究|合成|完成
用户约束:
深度: “全面”
时间框架: “未来十年”
预期输出: “带源的详细报告”
特殊要求: [“PDF分析”、“学术论文”]
阶段:
规划:
完成: true
时间戳: “2024-01-15T14:30:45Z”
用户响应:
研究方法: “带学术重点的多源”
关键领域: [“成本节约”、“采用障碍”、“专家预测”]
深度偏好: “深入带主要源”
分解:
完成: true
子问题:
- id: “当前AI医疗保健”
问题: “当前医疗保健中AI应用有哪些?”
状态: “完成”
优先级: “高”
- id: “成本节约证据”
问题: “已记录的成本节约是多少?”
状态: “进行中”
优先级: “高”
研究:
当前批处理: 2
批处理:
批处理1:
状态: “完成”
查询: [“AI医疗保健应用2024”、“机器学习医学诊断”]
找到的源: 12
批处理2:
状态: “进行中”
查询: [“AI医疗保健成本节约研究”、“ROI AI医疗工具”]
找到的源: 8
发现:
关键声明:
- id: “AI诊断准确性”
声明: “AI将诊断准确性提高10-30%”
置信度: “高”
来源: [“源1”、“源2”、“源3”]
验证状态: “三角验证”
最后更新: “2024-01-15T15:15:30Z”
矛盾:
- id: “成本节约时间线”
声明A: “可能立即成本节约”
声明B: “成本节约需2-3年”
解决策略: “进一步调查”
来源: [“学术论文2023”、“行业报告2024”]
缺口:
- 问题: “5年后的长期成本影响”
原因: “有限纵向研究”
缓解: “搜索专家预测和模型”
来源:
源1:
标题: “AI在医学成像中:系统回顾”
类型: “学术”
url: “https://example.com/paper1.pdf”
日期: “2024-01-10”
可信度分数: 14
关键声明: [“声明1”、“声明2”]
检查点:
- id: “中期研究回顾”
时间戳: “2024-01-15T15:45:00Z”
目前发现: “找到15个源,3个主要主题出现”
用户反馈: “方向看起来好,更多关注经济分析”
做出的调整: [“添加经济查询”、“优先ROI研究”]
合成:
状态: “待定”
大纲:
执行摘要: “AI将在5年内减少医疗保健成本5-15%”
关键发现:
- “诊断改进”
- “行政效率”
限制:
- “实施挑战”
- “监管障碍”
记忆管理规则
- 在研究开始时创建记忆文件 带时间戳
- 逐步更新 每个主要阶段或发现后
- 跨会话持久 - 允许恢复中断的研究
- 跟踪用户互动 - 存储反馈和修正
- 启用共享 - 记忆文件可导出/共享以协作
记忆驱动的研究流程
开始: 用户问题
↓
┌─────────────────┐
│ 初始化 │ ← 创建研究记忆文件
│ 记忆 │
└─────────────────┘
↓
┌─────────────────┐
│ 规划 │ ← 向用户询问澄清问题
│ 问题 │ 关于深度、格式、重点领域
└─────────────────┘
↓
┌─────────────────┐
│ 分解 │ ← 将问题分解为子问题
└─────────────────┘
↓
┌─────────────────┐ ┌─────────────────┐
│ 批处理 │ --> │ PDF/DOC │
│ 搜索 │ │ 分析 │
└─────────────────┘ └─────────────────┘
↓ ↓
┌─────────────────┐ ┌─────────────────┐
│ 发现 │ <-- │ 提取 │
│ 提取 │ │ 声明和 │
└─────────────────┘ │ 洞察 │
└─────────────────┘
↓
┌─────────────────┐
│ 检查点 │ ← 暂停以获取用户反馈
│ 和反馈 │ “这是正确方向吗?”
└─────────────────┘
↓
├─ 继续 ──→ [调整搜索策略]
│
├─ 转向 ─────→ [添加/移除重点领域]
│
└─ 深化 ────→ [更详细分析]
┌─────────────────┐
│ 验证 │ ← 交叉引用声明,检查矛盾
└─────────────────┘
↓
┌─────────────────┐
│ 合成 │ ← 构建全面报告
│ 和报告 │
└─────────────────┘
↓
┌─────────────────┐
│ 最终 │ ← 呈现给用户
│ 交付 │
└─────────────────┘
↓
┌─────────────────┐
│ 记忆 │ ← 存档供未来参考
│ 归档 │
└─────────────────┘
互动提问阶段
研究前问题
在研究开始前,向用户询问澄清问题:
## 研究规划问题
**1. 研究深度与范围**
您寻求什么级别的深度?
- [ ] 概述/总结(快速回答)
- [ ] 详细分析(全面覆盖)
- [ ] 专家级(学术论文、技术细节)
**2. 预期输出格式**
什么格式最有用?
- [ ] 执行摘要带关键发现
- [ ] 详细报告带证据和引用
- [ ] 比较分析
- [ ] 基于当前趋势的预测/预测
**3. 关键重点领域**
哪些方面对您最重要?(全选)
- [ ] 当前状态/趋势
- [ ] 未来预测
- [ ] 特定技术/地区
- [ ] 成本/效益分析
- [ ] 实施挑战
**4. 源偏好**
有偏好的源类型吗?
- [ ] 学术/研究论文
- [ ] 行业报告
- [ ] 新闻/媒体报道
- [ ] 政府数据
- [ ] 专家意见
**5. 时间敏感性**
时效性多重要?
- [ ] 非常重要(关注最新数据)
- [ ] 有些重要(平衡质量)
- [ ] 不重要(优先全面历史视图)
研究中检查点
定期暂停研究以验证方向:
## 研究检查点 - 批处理[N]完成
**目前发现:**
- [关键发现1]
- [关键发现2]
- [出现模式/趋势]
**方向检查:**
我们是否探索了正确领域?应该:
- [ ] 继续当前方向
- [ ] 转向不同重点领域
- [ ] 添加特定主题以调查
- [ ] 在某些领域减少范围
**深度调整:**
当前深度水平看起来[合适/过浅/过深]。应该:
- [ ] 保持当前深度
- [ ] 在[特定主题]上深化
- [ ] 更简要总结[特定主题]
**新出现的问题:**
- [研究中出现的问题]
- [需要额外澄清]
增强PDF与文档分析
PDF处理能力
对于全面研究,自动下载和分析:
- 学术论文:全文提取、引用分析、方法学审查
- 研究报告:执行摘要、数据提取、方法学评估
- 技术文档:API文档、实施指南、规范
- 政府报告:统计数据、政策分析、监管框架
PDF分析流程
PDF源 → 下载 → 文本提取 → 内容分析 → 关键洞察 → 记忆存储
↓ ↓ ↓ ↓ ↓ ↓
URL/标题 本地文件 结构化文本 声明/事实 摘要 研究记忆
文档智能功能
- 引用提取:跟踪参考文献并构建引用网络
- 图/表分析:从可视化中提取数据
- 方法学评估:评估研究严谨性和有效性
- 交叉引用验证:跨多个文档链接声明
- 内容总结:生成结构化摘要和关键发现
更新后的流程结构
增强的研究流程
┌─────────────────────────────────────────────────────────────────────┐
│ 1. 问题 → 2. 记忆初始化 → 3. 规划问题 → 4. 用户输入 │
│ │
│ 5. 分解 → 6. 记忆更新 → 7. 批处理搜索 → 8. PDF分析 │
│ │
│ 9. 验证 → 10. 检查点 → 11. 用户反馈 → 12. 调整 │
│ │
│ 13. 迭代或 → 14. 合成 → 15. 最终报告 → 16. 记忆归档 │
└─────────────────────────────────────────────────────────────────────┘
关键增强
- 记忆集成:所有阶段更新持久记忆
- 用户互动:多个检查点用于反馈和课程纠正
- 文档智能:高级PDF和论文分析能力
- 迭代精炼:研究基于发现和用户输入适应
- 全面跟踪:研究过程和决策的完整审计跟踪
附加资源
- 对于查询分解策略,见references/query-decomposition.md
- 对于验证模式,见references/verification-patterns.md