研究深入挖掘Skill research-deep-dive

系统性地进行深入研究,包括文献综述、技术比较、实施指南等,生成详细的研究报告。

文献检索 11 次安装 70 次浏览 更新于 2/27/2026

研究深入挖掘

通过系统性地搜索多个来源、收集论文、分析发现并创建详细的研究报告来进行深入研究。

快速开始:深入研究工作流程

最常用用途:用户需要对研究主题进行全面理解,包括全面的文献综述。

标准开头

用户:“我想研究变压器记忆机制。”

代理:“让我们对这个话题进行深入研究。我将:

1. 细化你的研究问题(具体化)
2. 计划多源搜索策略
3. 搜索发现+库藏+网络
4. 下载并排队处理论文
5. 阅读并分析所有来源
6. 综合发现
7. 创建全面的Markdown报告

这需要15-30分钟,取决于范围。准备好开始了吗?”

从第1阶段开始:细化研究目标。


诊断:什么类型的研究?

询问3个问题以了解研究需求:

问题1:研究类型?

代理:“您需要什么类型的研究输出?
A) 文献综述(现有工作的调查)
B) 技术比较(比较方法/方法)
C) 实施指南(如何构建某物)
D) 问题分析(理解特定问题)
E) 技术发展综述(最新的是什么?)”

问题2:需要的深度?

代理:“我们应该深入到什么程度?
A) 广泛调查(10-15篇论文,高层次概述)
B) 中等深度(5-8篇论文,详细分析)
C) 深入挖掘(3-5篇论文,全面的技术细节)
D) 穷尽(15+篇论文,所有可用的)”

问题3:时间范围?

代理:“论文的时间框架?
A) 仅最近(最后6个月)
B) 最后1-2年
C) 最后3-5年
D) 历史背景(基础论文+最近)”

根据答案选择路线:

文献综述+广泛+最近 → 快速多源搜索,10-15篇论文
技术比较+深入+历史 → 专注搜索,3-5篇关键论文,详细
实施指南+中等深度+最近 → 实践论文,代码示例

对话模式

模式1:第1阶段 - 细化研究目标

触发器:用户提供初始研究主题

用户:“我想研究变压器记忆机制。”

代理:“让我们细化一下。几个问题:

1. 关于记忆的具体是什么?
   - 注意力模式?
   - 上下文窗口大小?
   - 记忆增强技术?
   - 有效记忆使用?

2. 你这项研究的目标是什么?
   - 实施时理解?
   - 写综述?
   - 选择使用哪种方法?

3. 你需要多深?
   - 高层次概述?
   - 深入技术细节?
   - 实施准备知识?

[用户回答]

代理:“完美!细化后的研究问题:
'Transformer模型如何通过记忆增强技术扩展其有效的上下文窗口,重点关注实施权衡?'

听起来对吗?”

迭代直到具体,可操作的研究问题。

模式2:第2阶段 - 计划研究策略

触发器:研究问题清晰

代理:“研究问题锁定了!现在让我们计划搜索:

**要使用的来源**:
- ArXiv: ✓ (技术ML论文)
- Semantic Scholar: ✓ (更广泛的覆盖)
- 库藏: ✓ (检查现有笔记)
- 网络搜索:可选(如果需要博客文章/教程)

**主要关键词**:变压器记忆,上下文扩展,记忆增强
**相关概念**:长上下文,注意力机制,记忆网络
**关键作者**:(将从论文中发现)

**成功标准**:
- 分析8-10篇关键论文
- 理解3-4种主要方法
- 比较权衡
- 实施洞察

**目标**:全面但专注(不是穷尽的)

计划批准了吗?”

模式3:第3阶段 - 执行多源搜索

触发器:策略批准

代理:“正在跨来源执行搜索...

[使用每个来源的发现工具]

**发现结果**:
- ArXiv(最近2年):找到23篇论文
- Semantic Scholar:找到15篇论文
- 库藏搜索:2篇现有笔记

**总计**:40个来源

按相关性+引用次数优先...”

[运行相关性排名]

代理:“前10个最相关的:
1. [论文标题] - [相关性得分] - [引用]
2. [论文标题] - [相关性得分] - [引用]
...

这些涵盖了主要方法。用这10篇论文继续吗?”

模式4:第4阶段 - 收集与排队论文

触发器:选定论文

代理:“正在下载PDFs进行处理...

[使用每个论文的download_pdf工具]

论文1:✓ 下载 → queue/2026-01-14-paper1.pdf
论文2:✓ 下载 → queue/2026-01-14-paper2.pdf
...
论文10:✓ 下载 → queue/2026-01-14-paper10.pdf

所有PDFs在监控管道中排队。处理将需要~5分钟(每篇30秒)。

处理同时,我将:
- 阅读现有库藏笔记(即时)
- 搜索网络博客文章/教程(2分钟)
- 开始分析论文摘要(立即)

现在开始...”

模式5:第5阶段 - 阅读与分析

触发器:论文处理中或已处理

代理:“正在阅读来源并提取关键信息...

**库藏笔记**(已处理):
- 笔记1:Transformer-XL分析
  关键发现:段级递归用于长上下文
  相关性:基础方法

**论文摘要**(立即):
- 论文1:记忆网络变压器
  声称:上下文扩展10倍,开销<5%
  关键技术:外部记忆库

- 论文2:带记忆的高效注意力
  声称:O(n)复杂度vs O(n²)
  关键技术:压缩记忆令牌

[等待处理完成]

**处理过的论文**(全文现在可用):
- 论文1全文分析:
  - 架构:[图表/描述]
  - 结果:[性能数字]
  - 权衡:[速度vs准确性]

[继续所有论文]

所有10篇论文分析完毕!”

模式6:第6阶段 - 综合与识别差距

触发器:所有来源阅读完毕

代理:“发现的综合:

**主要方法发现**:
1. 外部记忆库(4篇论文)
   - 优点:大上下文扩展
   - 缺点:训练复杂性

2. 压缩记忆令牌(3篇论文)
   - 优点:高效,即插即用替换
   - 缺点:信息丢失

3. 层次注意力(2篇论文)
   - 优点:自然扩展
   - 缺点:需要架构更改

**关键权衡**:
- 速度vs上下文大小
- 训练成本vs推理成本
- 内存大小vs准确性

**我看到的差距**:
- 缺失:方法之间的直接比较
- 不清楚:生产部署经验
- 需要:方法2的实施细节

这些差距对你的目标重要吗?需要我再进行一轮搜索吗?”

[用户决定:迭代或最终确定]

模式7:第7阶段 - 迭代或最终确定

触发器:识别差距

如果需要迭代:

代理:“正在为差距进行专注搜索...

新查询:'变压器压缩记忆比较基准'
来源:ArXiv+网络(寻找实施帖子)

[执行精炼搜索]

找到3个额外的来源解决了差距。正在下载...”

[回到第4阶段与新论文]

如果准备最终确定:

代理:“差距对你的目标是可以接受的。转到报告创建!”

[转到第8阶段]

模式8:第8阶段 - 创建研究报告

触发器:研究完成,准备编写

代理:“正在创建全面的研究报告...

报告结构:
## 研究问题
## 方法论
## 关键发现
## 详细分析
  ### 方法1:外部记忆库
  ### 方法2:压缩记忆令牌
  ### 方法3:层次注意力
## 权衡&比较
## 实施建议
## 结论
## 参考文献(所有10+篇论文)

正在写报告...”

[生成Markdown报告]

代理:“报告完成!

保存到:vault/_thoth/research-reports/transformer-memory-mechanisms-2026-01-14.md
大小:12KB,约3000字

报告包括:
- 执行摘要
- 3种主要方法与技术细节
- 比较表
- 实施建议
- 完整参考文献列表与链接

现在打开它还是想让我总结关键发现?”

快速参考卡

卡1:8阶段工作流程

每个深入研究都遵循这个:

  1. 细化目标 - 获取具体的研究问题(5分钟)
  2. 计划策略 - 选择来源、关键词、标准(2分钟)
  3. 多源搜索 - 发现+库藏+网络(3分钟)
  4. 收集论文 - 下载&排队处理(5分钟)
  5. 阅读&分析 - 从所有来源提取关键发现(10分钟)
  6. 综合&差距检查 - 识别缺失信息(5分钟)
  7. 迭代或最终确定 - 如有需要进行更多搜索
  8. 创建报告 - 全面的Markdown(3分钟)

总时间:15-30分钟,取决于范围

卡2:来源选择策略

将来源与研究类型匹配:

研究类型 主要来源 次要来源
文献综述 ArXiv + Semantic Scholar 库藏笔记
技术比较 ArXiv(专注) 实施博客
实施指南 ArXiv + 网络 GitHub仓库
问题分析 Semantic Scholar 库藏+网络
技术发展 ArXiv(最近6mo) 会议网站

默认:ArXiv + Semantic Scholar + 库藏

卡3:论文选择标准

如何优先考虑论文:

主要过滤器:
- 相关性得分> 0.7(来自语义搜索)
- 引用次数> 10(除非非常新)
- 发表日期符合范围

次要过滤器:
- 作者声誉(知名研究人员)
- 场所质量(顶级会议/期刊)
- 摘要清晰度(写得好)

目标数量:
- 广泛调查:10-15篇论文
- 中等深度:5-8篇论文
- 深入挖掘:3-5篇论文

质量优于数量 - 彻底分析5篇关键论文比浏览20篇平庸论文要好。

卡4:综合模式

常见综合结构:

模式A:方法比较

主要方法:
1. 方法A
   - 论文:[1, 2, 3]
   - 关键思想:[...]
   - 优缺点:[...]

2. 方法B
   - 论文:[4, 5]
   - 关键思想:[...]
   - 优缺点:[...]

比较:[表格或分析]

模式B:随时间演变

历史背景:
- 2017:基础工作[论文1]
- 2019:第一次改进[论文2]
- 2021:突破[论文3]
- 2023:技术发展[论文4]

趋势:[进步方向]

模式C:问题-解决方案映射

问题:[研究问题]

尝试的解决方案:
- 解决方案1:[论文] - [有效性]
- 解决方案2:[论文] - [有效性]

最佳解决方案:[建议]

细化模式

细化1:范围太广

症状:搜索返回100+篇论文,压倒性

修复:缩小研究问题

代理:“最初的搜索太宽泛(找到150篇论文)。

让我们缩小一下。哪个方面最重要?
A) 特定技术(例如,只有记忆库)
B) 特定用例(例如,只有长文档)
C) 特定性能指标(例如,只有速度)
D) 特定时间段(例如,仅2023-2024)

选择一个将减少到~10-20篇论文。”

细化2:论文不够

症状:搜索返回<3篇论文

修复:扩大搜索

代理:“只找到2篇论文 - 太窄。让我们扩大:

选项A:包括相关概念(记忆→注意力)
选项B:扩大时间范围(1年→3年)
选项C:增加更多来源(添加网络搜索)
选项D:放松关键词匹配(语义搜索)

哪种方法?”

细化3:论文不相关

症状:下载的论文与研究目标不匹配

修复:细化关键词并重新搜索

代理:“这些论文没有很好地解决研究问题。

看看我们得到了什么与我们想要的:
- 得到:一般注意力论文
- 想要:特定记忆机制

让我细化搜索查询:
- 添加:'记忆扩展','上下文增强'
- 移除:'注意力'(太通用)
- 过滤器:摘要中必须提及'记忆'

正在运行细化搜索...”

细化4:综合太分散

症状:发现无法连接成连贯的叙述

修复:按主题重组

代理:“发现太分散了。让我按主题重组:

不是逐篇论文,而是按:
- 主题1:架构方法
- 主题2:性能权衡
- 主题3:实施考虑

每个主题将综合多篇论文的发现。

现在重组...”

细化5:缺少关键背景

症状:报告缺乏基础背景

修复:增加专注的历史搜索

代理:“这份报告需要更多关于基础的背景。

运行针对性搜索:
- 原始变压器论文(基础)
- 早期记忆工作(上下文)
- 关键调查(概述)

向报告背景添加2-3篇基础论文...”

故障排除

问题 快速修复
搜索太慢 减少来源,只关注ArXiv
论文无法下载 检查URL,使用替代来源
处理时间过长 排队耐心等待,或先阅读摘要
找不到特定论文 使用精确标题搜索
太多低质量论文 增加引用阈值>50
缺少实施细节 添加网络搜索博客帖子
报告太长 只关注前3种方法
报告太技术性 添加“简单解释”到综合
差距仍然存在 接受限制,在报告中注明
跟踪进度丢失 使用待办事项列表,检查每个阶段

高级:研究报告模板

标准报告结构:

# [研究主题]

**研究日期**:[date]
**分析论文**:[count]
**来源**:ArXiv, Semantic Scholar, 库藏

## 研究问题

[清晰,具体的问题]

## 方法论

- **搜索策略**:[关键词,来源]
- **选择标准**:[使用的过滤器]
- **审查论文**:[count和选择逻辑]

## 执行摘要

[2-3段落的发现概述]

## 关键发现

### 发现1:[标题]
[描述,支持论文]

### 发现2:[标题]
[描述,支持论文]

## 详细分析

### 方法1:[名称]

**关键论文**:[citations]
**核心思想**:[解释]
**技术细节**:[架构/方法]
**结果**:[性能数字]
**优点**:[优势]
**缺点**:[限制]

[重复每种方法]

## 权衡&比较

| 方面 | 方法1 | 方法2 | 方法3 |
|--------|-----------|------------|------------|
| 速度 | 快 | 中等 | 慢 |
| 准确性 | 高 | 中等 | 最高 |
| 内存 | 低 | 中等 | 高 |
| 复杂性 | 简单 | 中等 | 复杂 |

**建议**:[何时使用]

## 实施建议

1. **对于生产使用**:[方法+理由]
2. **对于研究**:[方法+理由]
3. **对于原型制作**:[方法+理由]

## 开放问题&未来工作

- [差距1]
- [差距2]
- [差距3]

## 结论

[发现和建议的总结]

## 参考文献

1. [论文1 - 完整引用链接]
2. [论文2 - 完整引用链接]
...

## 附录:搜索细节

- **使用的搜索查询**:[list]
- **排除的论文**:[count和原因]
- **处理笔记**:[任何问题]

总结:代理的心理模型

核心工作流程:

  1. 从宽泛开始,细化到具体研究问题
  2. 计划多源策略(发现+库藏+网络)
  3. 撒大网,然后按相关性过滤
  4. 下载&排队论文(并行处理)
  5. 系统性地阅读一切
  6. 按主题/方法综合(而不是按论文)
  7. 检查差距,如有需要进行迭代
  8. 创建全面的Markdown报告

关键原则:

  • 迭代细化:从宽泛→狭窄→专注
  • 多源:不要依赖单一来源
  • 质量优于数量:5篇好论文>20篇平庸论文
  • 系统性分析:从每个来源提取关键信息
  • 主题基础综合:按概念分组,而不是按论文
  • 差距意识:知道何时搜索更多
  • 可操作输出:报告包括建议

成功指标:用户对研究主题有全面的理解,并有详细的报告可以参考/分享。