深度研究Skill deep-research

这个技能用于执行复杂的多源深度研究,通过分解问题、并行搜索、验证证据和合成报告来分析复杂话题。它适用于需要全面分析、跨领域研究或专家级报告的场景,支持事实核查和冲突信息解决。关键词包括深度研究、多源分析、数据验证、报告合成、复杂问题解决、智能代理、知识整合、SEO研究工具、学术调研、商业智能分析。

数据分析 0 次安装 0 次浏览 更新于 3/15/2026

名称:深度研究 描述:为复杂问题进行全面的多源研究。当用户提出需要多个来源、深入分析、交叉引用或专家级研究报告的复杂问题时使用。触发词包括“研究”、“调查”、“深度探究”、“彻底分析”、“综合报告”或涉及冲突来源的问题。

深度研究

自主研究代理,用于需要合成、验证和专家级分析的复杂、多源问题。

何时激活

  • 需要多个来源的复杂问题
  • 信息冲突或微妙的话题
  • 要求进行全面分析或报告
  • 需要跨领域专业知识的问题
  • 带有源验证的事实核查

时间意识

尊重用户给出的时间框架。 如果未给出,则使用最新信息。

  1. 用户指定时间框架 → 将来源和声明限制在该期间内。
    • 示例:“今年”、“2024年”、“过去5年”、“近期研究”、“当前状态”
    • 在查询中:添加日期/年约束;在合成中,注明证据时间。
  2. 未给出时间框架 → 优先使用最新证据。
    • 事实和趋势:优先使用近期来源(例如,除非是历史话题,否则使用最近2-3年)。
    • 对于“当前状态”或“X的现状”:强调最新数据和报告。
    • 对于历史或“从何时开始”问题:使用用户询问的时间段。
  3. 始终记录发布时间在源日志中,并在报告中提到时效性(例如,“截至2024年…”或“基于2023年数据…”)。

研究流程

按顺序执行这些阶段。每个阶段都建立在前一个阶段的基础上。

┌─────────────────────────────────────────────────────────────────┐
│  1. 分解 → 2. 规划 → 3. 搜索 → 4. 验证 → 5. 合成 │
│       ↑                                    │                    │
│       └────────── 如有缺口则迭代 ─────────┘                    │
└─────────────────────────────────────────────────────────────────┘

阶段1:查询分解

将复杂问题分解为原子子问题。

分解策略

  1. 识别问题类型

    • 事实性(谁、什么、何时、何地)
    • 因果性(为什么、如何)
    • 比较性(哪个更好、差异)
    • 预测性(会发生什么)
    • 评价性(应该、是好是坏)
  2. 提取实体和关系

    • 关键概念、参与者、事件
    • 时间约束(日期、期间)
    • 范围约束(地理、领域)
  3. 生成子问题(目标3-7个):

    原始问题:“AI如何影响未来十年的医疗保健成本?”
    
    子问题:
    1. 当前医疗保健中AI应用有哪些?
    2. 现有AI医疗保健工具已记录的成本节约是多少?
    3. AI在医疗保健中的预计采用率是多少?
    4. AI可能影响的主要医疗保健成本驱动因素是什么?
    5. AI在医疗保健中采用的主要障碍是什么?
    6. 专家预测对AI医疗保健成本的看法是什么?
    
  4. 识别依赖关系

    • 哪些问题必须先回答?
    • 哪些可以并行搜索?

重构技术

对于每个子问题,生成2-3个搜索查询变体:

技术 示例
同义词扩展 “可再生能源” → “太阳能风能”、“清洁能源发电”
具体化阶梯 宽泛:“饮食益处” → 具体:“地中海饮食心血管2023”
源定位 添加:“研究论文”、“元分析”、“政府报告”
时效性过滤器 为时间敏感话题添加年份约束

阶段2:研究规划

在搜索前创建结构化研究计划。

计划模板

## 研究计划:[原始问题]

### 目标
[一句话目标]

### 子问题(优先级顺序)
1. [关键] 解锁其他问题的问
2. [高] 核心事实性问题
3. [中] 支持性上下文
4. [低] 可有可无的细节

### 搜索策略
- 并行批处理1:[Q1, Q2](独立)
- 顺序:Q3依赖于Q1结果
- 并行批处理2:[Q4, Q5]

### 源要求
- [ ] 学术来源(同行评审)
- [ ] 官方报告(政府、组织)
- [ ] 专家评论(信誉分析师)
- [ ] 近期新闻(12个月内)
- [ ] **时间框架**:用户指定(例如2024年、过去5年)或默认使用最新

### 置信度目标
[高/中] - 定义“足够好”的含义

阶段3:并行搜索执行

使用并行批处理高效执行搜索。

搜索执行规则

  1. 批处理独立查询:同时运行3-5个搜索
  2. 多样化源策略:混合查询变体以避免回音室效应
  3. 预算意识:跟踪搜索计数,目标10-20个总搜索

每搜索过程

对于每个搜索结果:

  1. 提取关键声明并注明来源归属
  2. 注意源类型(学术、新闻、博客、官方)
  3. 记录发布日期
  4. 标记矛盾与现有发现

源跟踪格式

## 源日志

### [源1:标题]
- URL:[链接]
- 类型:[学术/新闻/官方/专家/博客]
- 日期:[发布日期]
- 可信度:[高/中/低]
- 关键声明:
  - 声明1:“[引用或转述]”
  - 声明2:“[引用或转述]”
- 矛盾:[其他源(如适用)]

阶段4:迭代验证循环

关键阶段 - 不要跳过。在合成前验证。

验证协议

┌─────────────────────────────────────────┐
│  对于每个主要声明:                  │
│  1. 是否由2+个来源支持?      │
│  2. 来源是否有不同偏见?   │
│  3. 声明是否足够近期?         │
│  4. 是否有可信的矛盾?  │
└─────────────────────────────────────────┘

自我反思问题

初始搜索轮后,明确回答:

  1. 覆盖检查:“是否解决了所有子问题?”
  2. 置信度检查:“哪些声明证据薄弱?”
  3. 偏见检查:“我的来源是否意识形态多样?”
  4. 缺口检查:“缺少什么会改变结论?”
  5. 矛盾检查:“是否调查了冲突声明?”

迭代决策

条件 动作
子问题未回答 使用重构查询搜索
声明只有单一来源 搜索以确证
发现主要矛盾 搜索以解决/上下文
置信度目标达成 进行到合成
搜索预算耗尽 注明限制,进行

递归验证

对于高风险声明:

## 验证链:[声明]

级别1:原始源说X
级别2:源引用研究Y → 验证研究Y存在并说X
级别3:研究方法 → 是否严谨?

验证状态:[确认/部分确认/未验证/矛盾]

阶段5:合成与报告生成

将发现结合成连贯、引用充分的报告。

合成规则

  1. 以结论引领,以证据支持
  2. 引用每个事实声明并注明来源参考
  3. 明确承认不确定性
  4. 公平呈现矛盾,解释哪个观点支持更好
  5. 分离事实与解释

报告结构

始终以可见的“来源”或“参考文献”部分结束报告,列出使用的每个源。读者必须能看到并验证信息来源。

# [研究问题]

## 执行摘要
[2-3句话回答及置信度水平]

## 关键发现

### 发现1:[声明]
[带引用的证据合成]
- 源A报告...[1]
- 这由...[2]确证
- 然而,源C指出...[3]

### 发现2:[声明]
[带引用的证据合成]

## 分析
[您的解释连接发现]

## 限制与缺口
- [无法验证的内容]
- [需要更多研究的领域]
- [可用来源的潜在偏见]

## 置信度评估

| 声明   | 置信度 | 基础                    |
| ------- | ---------- | ------------------------ |
| 声明1 | 高       | 3+独立来源   |
| 声明2 | 中     | 2个来源,部分冲突 |
| 声明3 | 低        | 单一来源,近期    |

## 来源
[必需 — 列出使用的每个源,以便读者验证和跟进。]

[1] 作者或出版商,“标题”,出版物/网站,日期。URL
[2] 作者或出版商,“标题”,出版物/网站,日期。URL
[3] ...

显示使用的来源

  • 在每次深度研究报告结尾包括“来源”(或“参考文献”)部分
  • 列出每个源 用于支持发现,按引用顺序[1], [2]包括,…
  • 格式化每个条目 以便查找源:作者/出版商、标题、出版物/网站、日期和URL
  • 不要省略源 或将其摘要掉;完整列表必须在交付报告中可见

思维链模板

使用此内部推理结构:

**思考[问题]...**

1. 分解:在回答[Y]之前我需要理解[X]
2. 当前知识:我从[来源]发现[声明]
3. 识别的缺口:我还不知道[Z]
4. 矛盾:源A说X,但源B说Y
5. 解决策略:我将搜索[特定查询]以解决
6. 置信度更新:验证后,我[%]置信因为[原因]

避免的反模式

  • ❌ 对于复杂话题的单源结论
  • ❌ 忽略矛盾证据
  • ❌ 将所有源视为同等可信
  • ❌ 第一轮搜索后停止而不验证
  • ❌ 将不确定声明呈现为事实
  • ❌ 忘记引用来源
  • ❌ 回音室来源(所有来源同一视角)
  • ❌ 省略或隐藏来源列表(报告必须显示使用的所有源)

质量检查表

在交付最终报告前:

  • [ ] 所有子问题已解决
  • [ ] 每个声明都有引用
  • [ ] 矛盾已承认
  • [ ] 置信度水平已陈述
  • [ ] 限制已记录
  • [ ] 来源多样且可信
  • [ ] 时效性适合话题
  • [ ] 使用的源已显示:“来源”或“参考文献”部分列出每个源,含标题、出版物、日期和URL

记忆与持久系统

在结构化文件中跟踪研究进展,以跨会话保持上下文并支持更深分析。

记忆文件格式

# research-memory-[timestamp].yaml
研究:
  id: “深度研究-2024-01-15-143022”
  问题: “AI如何影响未来十年的医疗保健成本?”
  开始于: “2024-01-15T14:30:22Z”
  状态: “进行中”  # 规划|研究|合成|完成
  用户约束:
    深度: “全面”
    时间框架: “未来十年”
    预期输出: “带源的详细报告”
    特殊要求: [“PDF分析”、“学术论文”]

  阶段:
    规划:
      完成: true
      时间戳: “2024-01-15T14:30:45Z”
      用户响应:
        研究方法: “带学术重点的多源”
        关键领域: [“成本节约”、“采用障碍”、“专家预测”]
        深度偏好: “深入带主要源”

    分解:
      完成: true
      子问题:
        - id: “当前AI医疗保健”
          问题: “当前医疗保健中AI应用有哪些?”
          状态: “完成”
          优先级: “高”
        - id: “成本节约证据”
          问题: “已记录的成本节约是多少?”
          状态: “进行中”
          优先级: “高”

    研究:
      当前批处理: 2
      批处理:
        批处理1:
          状态: “完成”
          查询: [“AI医疗保健应用2024”、“机器学习医学诊断”]
          找到的源: 12
        批处理2:
          状态: “进行中”
          查询: [“AI医疗保健成本节约研究”、“ROI AI医疗工具”]
          找到的源: 8

  发现:
    关键声明:
      - id: “AI诊断准确性”
        声明: “AI将诊断准确性提高10-30%”
        置信度: “高”
        来源: [“源1”、“源2”、“源3”]
        验证状态: “三角验证”
        最后更新: “2024-01-15T15:15:30Z”

    矛盾:
      - id: “成本节约时间线”
        声明A: “可能立即成本节约”
        声明B: “成本节约需2-3年”
        解决策略: “进一步调查”
        来源: [“学术论文2023”、“行业报告2024”]

    缺口:
      - 问题: “5年后的长期成本影响”
        原因: “有限纵向研究”
        缓解: “搜索专家预测和模型”

  来源:
    源1:
      标题: “AI在医学成像中:系统回顾”
      类型: “学术”
      url: “https://example.com/paper1.pdf”
      日期: “2024-01-10”
      可信度分数: 14
      关键声明: [“声明1”、“声明2”]

  检查点:
    - id: “中期研究回顾”
      时间戳: “2024-01-15T15:45:00Z”
      目前发现: “找到15个源,3个主要主题出现”
      用户反馈: “方向看起来好,更多关注经济分析”
      做出的调整: [“添加经济查询”、“优先ROI研究”]

  合成:
    状态: “待定”
    大纲:
      执行摘要: “AI将在5年内减少医疗保健成本5-15%”
      关键发现:
        - “诊断改进”
        - “行政效率”
      限制:
        - “实施挑战”
        - “监管障碍”

记忆管理规则

  1. 在研究开始时创建记忆文件 带时间戳
  2. 逐步更新 每个主要阶段或发现后
  3. 跨会话持久 - 允许恢复中断的研究
  4. 跟踪用户互动 - 存储反馈和修正
  5. 启用共享 - 记忆文件可导出/共享以协作

记忆驱动的研究流程

开始: 用户问题
       ↓
┌─────────────────┐
│   初始化      │ ← 创建研究记忆文件
│   记忆       │
└─────────────────┘
       ↓
┌─────────────────┐
│   规划      │ ← 向用户询问澄清问题
│   问题      │   关于深度、格式、重点领域
└─────────────────┘
       ↓
┌─────────────────┐
│ 分解   │ ← 将问题分解为子问题
└─────────────────┘
       ↓
┌─────────────────┐     ┌─────────────────┐
│   批处理      │ --> │   PDF/DOC       │
│   搜索        │     │   分析      │
└─────────────────┘     └─────────────────┘
       ↓                           ↓
┌─────────────────┐     ┌─────────────────┐
│  发现      │ <-- │   提取      │
│ 提取      │     │   声明和      │
└─────────────────┘     │   洞察      │
                        └─────────────────┘
       ↓
┌─────────────────┐
│  检查点     │ ← 暂停以获取用户反馈
│  和反馈     │   “这是正确方向吗?”
└─────────────────┘
       ↓
       ├─ 继续 ──→ [调整搜索策略]
       │
       ├─ 转向 ─────→ [添加/移除重点领域]
       │
       └─ 深化 ────→ [更详细分析]

┌─────────────────┐
│ 验证    │ ← 交叉引用声明,检查矛盾
└─────────────────┘
       ↓
┌─────────────────┐
│   合成     │ ← 构建全面报告
│   和报告      │
└─────────────────┘
       ↓
┌─────────────────┐
│   最终         │ ← 呈现给用户
│   交付      │
└─────────────────┘
       ↓
┌─────────────────┐
│  记忆         │ ← 存档供未来参考
│  归档       │
└─────────────────┘

互动提问阶段

研究前问题

在研究开始前,向用户询问澄清问题:

## 研究规划问题

**1. 研究深度与范围**
您寻求什么级别的深度?
- [ ] 概述/总结(快速回答)
- [ ] 详细分析(全面覆盖)
- [ ] 专家级(学术论文、技术细节)

**2. 预期输出格式**
什么格式最有用?
- [ ] 执行摘要带关键发现
- [ ] 详细报告带证据和引用
- [ ] 比较分析
- [ ] 基于当前趋势的预测/预测

**3. 关键重点领域**
哪些方面对您最重要?(全选)
- [ ] 当前状态/趋势
- [ ] 未来预测
- [ ] 特定技术/地区
- [ ] 成本/效益分析
- [ ] 实施挑战

**4. 源偏好**
有偏好的源类型吗?
- [ ] 学术/研究论文
- [ ] 行业报告
- [ ] 新闻/媒体报道
- [ ] 政府数据
- [ ] 专家意见

**5. 时间敏感性**
时效性多重要?
- [ ] 非常重要(关注最新数据)
- [ ] 有些重要(平衡质量)
- [ ] 不重要(优先全面历史视图)

研究中检查点

定期暂停研究以验证方向:

## 研究检查点 - 批处理[N]完成

**目前发现:**
- [关键发现1]
- [关键发现2]
- [出现模式/趋势]

**方向检查:**
我们是否探索了正确领域?应该:
- [ ] 继续当前方向
- [ ] 转向不同重点领域
- [ ] 添加特定主题以调查
- [ ] 在某些领域减少范围

**深度调整:**
当前深度水平看起来[合适/过浅/过深]。应该:
- [ ] 保持当前深度
- [ ] 在[特定主题]上深化
- [ ] 更简要总结[特定主题]

**新出现的问题:**
- [研究中出现的问题]
- [需要额外澄清]

增强PDF与文档分析

PDF处理能力

对于全面研究,自动下载和分析:

  1. 学术论文:全文提取、引用分析、方法学审查
  2. 研究报告:执行摘要、数据提取、方法学评估
  3. 技术文档:API文档、实施指南、规范
  4. 政府报告:统计数据、政策分析、监管框架

PDF分析流程

PDF源 → 下载 → 文本提取 → 内容分析 → 关键洞察 → 记忆存储
     ↓              ↓            ↓                ↓              ↓            ↓
  URL/标题     本地文件    结构化文本   声明/事实   摘要   研究记忆

文档智能功能

  • 引用提取:跟踪参考文献并构建引用网络
  • 图/表分析:从可视化中提取数据
  • 方法学评估:评估研究严谨性和有效性
  • 交叉引用验证:跨多个文档链接声明
  • 内容总结:生成结构化摘要和关键发现

更新后的流程结构

增强的研究流程

┌─────────────────────────────────────────────────────────────────────┐
│  1. 问题 → 2. 记忆初始化 → 3. 规划问题 → 4. 用户输入 │
│                                                                     │
│  5. 分解 → 6. 记忆更新 → 7. 批处理搜索 → 8. PDF分析 │
│                                                                     │
│  9. 验证 → 10. 检查点 → 11. 用户反馈 → 12. 调整 │
│                                                                     │
│  13. 迭代或 → 14. 合成 → 15. 最终报告 → 16. 记忆归档 │
└─────────────────────────────────────────────────────────────────────┘

关键增强

  1. 记忆集成:所有阶段更新持久记忆
  2. 用户互动:多个检查点用于反馈和课程纠正
  3. 文档智能:高级PDF和论文分析能力
  4. 迭代精炼:研究基于发现和用户输入适应
  5. 全面跟踪:研究过程和决策的完整审计跟踪

附加资源