研究深入挖掘
通过系统性地搜索多个来源、收集论文、分析发现并创建详细的研究报告来进行深入研究。
快速开始:深入研究工作流程
最常用用途:用户需要对研究主题进行全面理解,包括全面的文献综述。
标准开头
用户:“我想研究变压器记忆机制。”
代理:“让我们对这个话题进行深入研究。我将:
1. 细化你的研究问题(具体化)
2. 计划多源搜索策略
3. 搜索发现+库藏+网络
4. 下载并排队处理论文
5. 阅读并分析所有来源
6. 综合发现
7. 创建全面的Markdown报告
这需要15-30分钟,取决于范围。准备好开始了吗?”
从第1阶段开始:细化研究目标。
诊断:什么类型的研究?
询问3个问题以了解研究需求:
问题1:研究类型?
代理:“您需要什么类型的研究输出?
A) 文献综述(现有工作的调查)
B) 技术比较(比较方法/方法)
C) 实施指南(如何构建某物)
D) 问题分析(理解特定问题)
E) 技术发展综述(最新的是什么?)”
问题2:需要的深度?
代理:“我们应该深入到什么程度?
A) 广泛调查(10-15篇论文,高层次概述)
B) 中等深度(5-8篇论文,详细分析)
C) 深入挖掘(3-5篇论文,全面的技术细节)
D) 穷尽(15+篇论文,所有可用的)”
问题3:时间范围?
代理:“论文的时间框架?
A) 仅最近(最后6个月)
B) 最后1-2年
C) 最后3-5年
D) 历史背景(基础论文+最近)”
根据答案选择路线:
文献综述+广泛+最近 → 快速多源搜索,10-15篇论文
技术比较+深入+历史 → 专注搜索,3-5篇关键论文,详细
实施指南+中等深度+最近 → 实践论文,代码示例
对话模式
模式1:第1阶段 - 细化研究目标
触发器:用户提供初始研究主题
用户:“我想研究变压器记忆机制。”
代理:“让我们细化一下。几个问题:
1. 关于记忆的具体是什么?
- 注意力模式?
- 上下文窗口大小?
- 记忆增强技术?
- 有效记忆使用?
2. 你这项研究的目标是什么?
- 实施时理解?
- 写综述?
- 选择使用哪种方法?
3. 你需要多深?
- 高层次概述?
- 深入技术细节?
- 实施准备知识?
[用户回答]
代理:“完美!细化后的研究问题:
'Transformer模型如何通过记忆增强技术扩展其有效的上下文窗口,重点关注实施权衡?'
听起来对吗?”
迭代直到具体,可操作的研究问题。
模式2:第2阶段 - 计划研究策略
触发器:研究问题清晰
代理:“研究问题锁定了!现在让我们计划搜索:
**要使用的来源**:
- ArXiv: ✓ (技术ML论文)
- Semantic Scholar: ✓ (更广泛的覆盖)
- 库藏: ✓ (检查现有笔记)
- 网络搜索:可选(如果需要博客文章/教程)
**主要关键词**:变压器记忆,上下文扩展,记忆增强
**相关概念**:长上下文,注意力机制,记忆网络
**关键作者**:(将从论文中发现)
**成功标准**:
- 分析8-10篇关键论文
- 理解3-4种主要方法
- 比较权衡
- 实施洞察
**目标**:全面但专注(不是穷尽的)
计划批准了吗?”
模式3:第3阶段 - 执行多源搜索
触发器:策略批准
代理:“正在跨来源执行搜索...
[使用每个来源的发现工具]
**发现结果**:
- ArXiv(最近2年):找到23篇论文
- Semantic Scholar:找到15篇论文
- 库藏搜索:2篇现有笔记
**总计**:40个来源
按相关性+引用次数优先...”
[运行相关性排名]
代理:“前10个最相关的:
1. [论文标题] - [相关性得分] - [引用]
2. [论文标题] - [相关性得分] - [引用]
...
这些涵盖了主要方法。用这10篇论文继续吗?”
模式4:第4阶段 - 收集与排队论文
触发器:选定论文
代理:“正在下载PDFs进行处理...
[使用每个论文的download_pdf工具]
论文1:✓ 下载 → queue/2026-01-14-paper1.pdf
论文2:✓ 下载 → queue/2026-01-14-paper2.pdf
...
论文10:✓ 下载 → queue/2026-01-14-paper10.pdf
所有PDFs在监控管道中排队。处理将需要~5分钟(每篇30秒)。
处理同时,我将:
- 阅读现有库藏笔记(即时)
- 搜索网络博客文章/教程(2分钟)
- 开始分析论文摘要(立即)
现在开始...”
模式5:第5阶段 - 阅读与分析
触发器:论文处理中或已处理
代理:“正在阅读来源并提取关键信息...
**库藏笔记**(已处理):
- 笔记1:Transformer-XL分析
关键发现:段级递归用于长上下文
相关性:基础方法
**论文摘要**(立即):
- 论文1:记忆网络变压器
声称:上下文扩展10倍,开销<5%
关键技术:外部记忆库
- 论文2:带记忆的高效注意力
声称:O(n)复杂度vs O(n²)
关键技术:压缩记忆令牌
[等待处理完成]
**处理过的论文**(全文现在可用):
- 论文1全文分析:
- 架构:[图表/描述]
- 结果:[性能数字]
- 权衡:[速度vs准确性]
[继续所有论文]
所有10篇论文分析完毕!”
模式6:第6阶段 - 综合与识别差距
触发器:所有来源阅读完毕
代理:“发现的综合:
**主要方法发现**:
1. 外部记忆库(4篇论文)
- 优点:大上下文扩展
- 缺点:训练复杂性
2. 压缩记忆令牌(3篇论文)
- 优点:高效,即插即用替换
- 缺点:信息丢失
3. 层次注意力(2篇论文)
- 优点:自然扩展
- 缺点:需要架构更改
**关键权衡**:
- 速度vs上下文大小
- 训练成本vs推理成本
- 内存大小vs准确性
**我看到的差距**:
- 缺失:方法之间的直接比较
- 不清楚:生产部署经验
- 需要:方法2的实施细节
这些差距对你的目标重要吗?需要我再进行一轮搜索吗?”
[用户决定:迭代或最终确定]
模式7:第7阶段 - 迭代或最终确定
触发器:识别差距
如果需要迭代:
代理:“正在为差距进行专注搜索...
新查询:'变压器压缩记忆比较基准'
来源:ArXiv+网络(寻找实施帖子)
[执行精炼搜索]
找到3个额外的来源解决了差距。正在下载...”
[回到第4阶段与新论文]
如果准备最终确定:
代理:“差距对你的目标是可以接受的。转到报告创建!”
[转到第8阶段]
模式8:第8阶段 - 创建研究报告
触发器:研究完成,准备编写
代理:“正在创建全面的研究报告...
报告结构:
## 研究问题
## 方法论
## 关键发现
## 详细分析
### 方法1:外部记忆库
### 方法2:压缩记忆令牌
### 方法3:层次注意力
## 权衡&比较
## 实施建议
## 结论
## 参考文献(所有10+篇论文)
正在写报告...”
[生成Markdown报告]
代理:“报告完成!
保存到:vault/_thoth/research-reports/transformer-memory-mechanisms-2026-01-14.md
大小:12KB,约3000字
报告包括:
- 执行摘要
- 3种主要方法与技术细节
- 比较表
- 实施建议
- 完整参考文献列表与链接
现在打开它还是想让我总结关键发现?”
快速参考卡
卡1:8阶段工作流程
每个深入研究都遵循这个:
- 细化目标 - 获取具体的研究问题(5分钟)
- 计划策略 - 选择来源、关键词、标准(2分钟)
- 多源搜索 - 发现+库藏+网络(3分钟)
- 收集论文 - 下载&排队处理(5分钟)
- 阅读&分析 - 从所有来源提取关键发现(10分钟)
- 综合&差距检查 - 识别缺失信息(5分钟)
- 迭代或最终确定 - 如有需要进行更多搜索
- 创建报告 - 全面的Markdown(3分钟)
总时间:15-30分钟,取决于范围
卡2:来源选择策略
将来源与研究类型匹配:
| 研究类型 | 主要来源 | 次要来源 |
|---|---|---|
| 文献综述 | ArXiv + Semantic Scholar | 库藏笔记 |
| 技术比较 | ArXiv(专注) | 实施博客 |
| 实施指南 | ArXiv + 网络 | GitHub仓库 |
| 问题分析 | Semantic Scholar | 库藏+网络 |
| 技术发展 | ArXiv(最近6mo) | 会议网站 |
默认:ArXiv + Semantic Scholar + 库藏
卡3:论文选择标准
如何优先考虑论文:
主要过滤器:
- 相关性得分> 0.7(来自语义搜索)
- 引用次数> 10(除非非常新)
- 发表日期符合范围
次要过滤器:
- 作者声誉(知名研究人员)
- 场所质量(顶级会议/期刊)
- 摘要清晰度(写得好)
目标数量:
- 广泛调查:10-15篇论文
- 中等深度:5-8篇论文
- 深入挖掘:3-5篇论文
质量优于数量 - 彻底分析5篇关键论文比浏览20篇平庸论文要好。
卡4:综合模式
常见综合结构:
模式A:方法比较
主要方法:
1. 方法A
- 论文:[1, 2, 3]
- 关键思想:[...]
- 优缺点:[...]
2. 方法B
- 论文:[4, 5]
- 关键思想:[...]
- 优缺点:[...]
比较:[表格或分析]
模式B:随时间演变
历史背景:
- 2017:基础工作[论文1]
- 2019:第一次改进[论文2]
- 2021:突破[论文3]
- 2023:技术发展[论文4]
趋势:[进步方向]
模式C:问题-解决方案映射
问题:[研究问题]
尝试的解决方案:
- 解决方案1:[论文] - [有效性]
- 解决方案2:[论文] - [有效性]
最佳解决方案:[建议]
细化模式
细化1:范围太广
症状:搜索返回100+篇论文,压倒性
修复:缩小研究问题
代理:“最初的搜索太宽泛(找到150篇论文)。
让我们缩小一下。哪个方面最重要?
A) 特定技术(例如,只有记忆库)
B) 特定用例(例如,只有长文档)
C) 特定性能指标(例如,只有速度)
D) 特定时间段(例如,仅2023-2024)
选择一个将减少到~10-20篇论文。”
细化2:论文不够
症状:搜索返回<3篇论文
修复:扩大搜索
代理:“只找到2篇论文 - 太窄。让我们扩大:
选项A:包括相关概念(记忆→注意力)
选项B:扩大时间范围(1年→3年)
选项C:增加更多来源(添加网络搜索)
选项D:放松关键词匹配(语义搜索)
哪种方法?”
细化3:论文不相关
症状:下载的论文与研究目标不匹配
修复:细化关键词并重新搜索
代理:“这些论文没有很好地解决研究问题。
看看我们得到了什么与我们想要的:
- 得到:一般注意力论文
- 想要:特定记忆机制
让我细化搜索查询:
- 添加:'记忆扩展','上下文增强'
- 移除:'注意力'(太通用)
- 过滤器:摘要中必须提及'记忆'
正在运行细化搜索...”
细化4:综合太分散
症状:发现无法连接成连贯的叙述
修复:按主题重组
代理:“发现太分散了。让我按主题重组:
不是逐篇论文,而是按:
- 主题1:架构方法
- 主题2:性能权衡
- 主题3:实施考虑
每个主题将综合多篇论文的发现。
现在重组...”
细化5:缺少关键背景
症状:报告缺乏基础背景
修复:增加专注的历史搜索
代理:“这份报告需要更多关于基础的背景。
运行针对性搜索:
- 原始变压器论文(基础)
- 早期记忆工作(上下文)
- 关键调查(概述)
向报告背景添加2-3篇基础论文...”
故障排除
| 问题 | 快速修复 |
|---|---|
| 搜索太慢 | 减少来源,只关注ArXiv |
| 论文无法下载 | 检查URL,使用替代来源 |
| 处理时间过长 | 排队耐心等待,或先阅读摘要 |
| 找不到特定论文 | 使用精确标题搜索 |
| 太多低质量论文 | 增加引用阈值>50 |
| 缺少实施细节 | 添加网络搜索博客帖子 |
| 报告太长 | 只关注前3种方法 |
| 报告太技术性 | 添加“简单解释”到综合 |
| 差距仍然存在 | 接受限制,在报告中注明 |
| 跟踪进度丢失 | 使用待办事项列表,检查每个阶段 |
高级:研究报告模板
标准报告结构:
# [研究主题]
**研究日期**:[date]
**分析论文**:[count]
**来源**:ArXiv, Semantic Scholar, 库藏
## 研究问题
[清晰,具体的问题]
## 方法论
- **搜索策略**:[关键词,来源]
- **选择标准**:[使用的过滤器]
- **审查论文**:[count和选择逻辑]
## 执行摘要
[2-3段落的发现概述]
## 关键发现
### 发现1:[标题]
[描述,支持论文]
### 发现2:[标题]
[描述,支持论文]
## 详细分析
### 方法1:[名称]
**关键论文**:[citations]
**核心思想**:[解释]
**技术细节**:[架构/方法]
**结果**:[性能数字]
**优点**:[优势]
**缺点**:[限制]
[重复每种方法]
## 权衡&比较
| 方面 | 方法1 | 方法2 | 方法3 |
|--------|-----------|------------|------------|
| 速度 | 快 | 中等 | 慢 |
| 准确性 | 高 | 中等 | 最高 |
| 内存 | 低 | 中等 | 高 |
| 复杂性 | 简单 | 中等 | 复杂 |
**建议**:[何时使用]
## 实施建议
1. **对于生产使用**:[方法+理由]
2. **对于研究**:[方法+理由]
3. **对于原型制作**:[方法+理由]
## 开放问题&未来工作
- [差距1]
- [差距2]
- [差距3]
## 结论
[发现和建议的总结]
## 参考文献
1. [论文1 - 完整引用链接]
2. [论文2 - 完整引用链接]
...
## 附录:搜索细节
- **使用的搜索查询**:[list]
- **排除的论文**:[count和原因]
- **处理笔记**:[任何问题]
总结:代理的心理模型
核心工作流程:
- 从宽泛开始,细化到具体研究问题
- 计划多源策略(发现+库藏+网络)
- 撒大网,然后按相关性过滤
- 下载&排队论文(并行处理)
- 系统性地阅读一切
- 按主题/方法综合(而不是按论文)
- 检查差距,如有需要进行迭代
- 创建全面的Markdown报告
关键原则:
- 迭代细化:从宽泛→狭窄→专注
- 多源:不要依赖单一来源
- 质量优于数量:5篇好论文>20篇平庸论文
- 系统性分析:从每个来源提取关键信息
- 主题基础综合:按概念分组,而不是按论文
- 差距意识:知道何时搜索更多
- 可操作输出:报告包括建议
成功指标:用户对研究主题有全面的理解,并有详细的报告可以参考/分享。