研究深入挖掘

通过系统性地搜索多个来源、收集论文、分析发现并创建详细的研究报告来进行深入研究。

快速开始：深入研究工作流程

最常用用途：用户需要对研究主题进行全面理解，包括全面的文献综述。

标准开头

用户：“我想研究变压器记忆机制。”

代理：“让我们对这个话题进行深入研究。我将：

1. 细化你的研究问题（具体化）
2. 计划多源搜索策略
3. 搜索发现+库藏+网络
4. 下载并排队处理论文
5. 阅读并分析所有来源
6. 综合发现
7. 创建全面的Markdown报告

这需要15-30分钟，取决于范围。准备好开始了吗？”

从第1阶段开始：细化研究目标。

诊断：什么类型的研究？

询问3个问题以了解研究需求：

问题1：研究类型？

代理：“您需要什么类型的研究输出？
A) 文献综述（现有工作的调查）
B) 技术比较（比较方法/方法）
C) 实施指南（如何构建某物）
D) 问题分析（理解特定问题）
E) 技术发展综述（最新的是什么？）”

问题2：需要的深度？

代理：“我们应该深入到什么程度？
A) 广泛调查（10-15篇论文，高层次概述）
B) 中等深度（5-8篇论文，详细分析）
C) 深入挖掘（3-5篇论文，全面的技术细节）
D) 穷尽（15+篇论文，所有可用的）”

问题3：时间范围？

代理：“论文的时间框架？
A) 仅最近（最后6个月）
B) 最后1-2年
C) 最后3-5年
D) 历史背景（基础论文+最近）”

根据答案选择路线：

文献综述+广泛+最近 → 快速多源搜索，10-15篇论文
技术比较+深入+历史 → 专注搜索，3-5篇关键论文，详细
实施指南+中等深度+最近 → 实践论文，代码示例

对话模式

模式1：第1阶段 - 细化研究目标

触发器：用户提供初始研究主题

用户：“我想研究变压器记忆机制。”

代理：“让我们细化一下。几个问题：

1. 关于记忆的具体是什么？
   - 注意力模式？
   - 上下文窗口大小？
   - 记忆增强技术？
   - 有效记忆使用？

2. 你这项研究的目标是什么？
   - 实施时理解？
   - 写综述？
   - 选择使用哪种方法？

3. 你需要多深？
   - 高层次概述？
   - 深入技术细节？
   - 实施准备知识？

[用户回答]

代理：“完美！细化后的研究问题：
'Transformer模型如何通过记忆增强技术扩展其有效的上下文窗口，重点关注实施权衡？'

听起来对吗？”

迭代直到具体，可操作的研究问题。

模式2：第2阶段 - 计划研究策略

触发器：研究问题清晰

代理：“研究问题锁定了！现在让我们计划搜索：

**要使用的来源**：
- ArXiv： ✓ （技术ML论文）
- Semantic Scholar： ✓ （更广泛的覆盖）
- 库藏： ✓ （检查现有笔记）
- 网络搜索：可选（如果需要博客文章/教程）

**主要关键词**：变压器记忆，上下文扩展，记忆增强
**相关概念**：长上下文，注意力机制，记忆网络
**关键作者**：（将从论文中发现）

**成功标准**：
- 分析8-10篇关键论文
- 理解3-4种主要方法
- 比较权衡
- 实施洞察

**目标**：全面但专注（不是穷尽的）

计划批准了吗？”

模式3：第3阶段 - 执行多源搜索

触发器：策略批准

代理：“正在跨来源执行搜索...

[使用每个来源的发现工具]

**发现结果**：
- ArXiv（最近2年）：找到23篇论文
- Semantic Scholar：找到15篇论文
- 库藏搜索：2篇现有笔记

**总计**：40个来源

按相关性+引用次数优先...”

[运行相关性排名]

代理：“前10个最相关的：
1. [论文标题] - [相关性得分] - [引用]
2. [论文标题] - [相关性得分] - [引用]
...

这些涵盖了主要方法。用这10篇论文继续吗？”

模式4：第4阶段 - 收集与排队论文

触发器：选定论文

代理：“正在下载PDFs进行处理...

[使用每个论文的download_pdf工具]

论文1：✓ 下载 → queue/2026-01-14-paper1.pdf
论文2：✓ 下载 → queue/2026-01-14-paper2.pdf
...
论文10：✓ 下载 → queue/2026-01-14-paper10.pdf

所有PDFs在监控管道中排队。处理将需要~5分钟（每篇30秒）。

处理同时，我将：
- 阅读现有库藏笔记（即时）
- 搜索网络博客文章/教程（2分钟）
- 开始分析论文摘要（立即）

现在开始...”

模式5：第5阶段 - 阅读与分析

触发器：论文处理中或已处理

代理：“正在阅读来源并提取关键信息...

**库藏笔记**（已处理）：
- 笔记1：Transformer-XL分析
  关键发现：段级递归用于长上下文
  相关性：基础方法

**论文摘要**（立即）：
- 论文1：记忆网络变压器
  声称：上下文扩展10倍，开销<5%
  关键技术：外部记忆库

- 论文2：带记忆的高效注意力
  声称：O(n)复杂度vs O(n²)
  关键技术：压缩记忆令牌

[等待处理完成]

**处理过的论文**（全文现在可用）：
- 论文1全文分析：
  - 架构：[图表/描述]
  - 结果：[性能数字]
  - 权衡：[速度vs准确性]

[继续所有论文]

所有10篇论文分析完毕！”

模式6：第6阶段 - 综合与识别差距

触发器：所有来源阅读完毕

代理：“发现的综合：

**主要方法发现**：
1. 外部记忆库（4篇论文）
   - 优点：大上下文扩展
   - 缺点：训练复杂性

2. 压缩记忆令牌（3篇论文）
   - 优点：高效，即插即用替换
   - 缺点：信息丢失

3. 层次注意力（2篇论文）
   - 优点：自然扩展
   - 缺点：需要架构更改

**关键权衡**：
- 速度vs上下文大小
- 训练成本vs推理成本
- 内存大小vs准确性

**我看到的差距**：
- 缺失：方法之间的直接比较
- 不清楚：生产部署经验
- 需要：方法2的实施细节

这些差距对你的目标重要吗？需要我再进行一轮搜索吗？”

[用户决定：迭代或最终确定]

模式7：第7阶段 - 迭代或最终确定

触发器：识别差距

如果需要迭代：

代理：“正在为差距进行专注搜索...

新查询：'变压器压缩记忆比较基准'
来源：ArXiv+网络（寻找实施帖子）

[执行精炼搜索]

找到3个额外的来源解决了差距。正在下载...”

[回到第4阶段与新论文]

如果准备最终确定：

代理：“差距对你的目标是可以接受的。转到报告创建！”

[转到第8阶段]

模式8：第8阶段 - 创建研究报告

触发器：研究完成，准备编写

代理：“正在创建全面的研究报告...

报告结构：
## 研究问题
## 方法论
## 关键发现
## 详细分析
  ### 方法1：外部记忆库
  ### 方法2：压缩记忆令牌
  ### 方法3：层次注意力
## 权衡&比较
## 实施建议
## 结论
## 参考文献（所有10+篇论文）

正在写报告...”

[生成Markdown报告]

代理：“报告完成！

保存到：vault/_thoth/research-reports/transformer-memory-mechanisms-2026-01-14.md
大小：12KB，约3000字

报告包括：
- 执行摘要
- 3种主要方法与技术细节
- 比较表
- 实施建议
- 完整参考文献列表与链接

现在打开它还是想让我总结关键发现？”

快速参考卡

卡1：8阶段工作流程

每个深入研究都遵循这个：

细化目标 - 获取具体的研究问题（5分钟）
计划策略 - 选择来源、关键词、标准（2分钟）
多源搜索 - 发现+库藏+网络（3分钟）
收集论文 - 下载&排队处理（5分钟）
阅读&分析 - 从所有来源提取关键发现（10分钟）
综合&差距检查 - 识别缺失信息（5分钟）
迭代或最终确定 - 如有需要进行更多搜索
创建报告 - 全面的Markdown（3分钟）

总时间：15-30分钟，取决于范围

卡2：来源选择策略

将来源与研究类型匹配：

研究类型	主要来源	次要来源
文献综述	ArXiv + Semantic Scholar	库藏笔记
技术比较	ArXiv（专注）	实施博客
实施指南	ArXiv + 网络	GitHub仓库
问题分析	Semantic Scholar	库藏+网络
技术发展	ArXiv（最近6mo）	会议网站

默认：ArXiv + Semantic Scholar + 库藏

卡3：论文选择标准

如何优先考虑论文：

主要过滤器：
- 相关性得分> 0.7（来自语义搜索）
- 引用次数> 10（除非非常新）
- 发表日期符合范围

次要过滤器：
- 作者声誉（知名研究人员）
- 场所质量（顶级会议/期刊）
- 摘要清晰度（写得好）

目标数量：
- 广泛调查：10-15篇论文
- 中等深度：5-8篇论文
- 深入挖掘：3-5篇论文

质量优于数量 - 彻底分析5篇关键论文比浏览20篇平庸论文要好。

卡4：综合模式

常见综合结构：

模式A：方法比较

主要方法：
1. 方法A
   - 论文：[1, 2, 3]
   - 关键思想：[...]
   - 优缺点：[...]

2. 方法B
   - 论文：[4, 5]
   - 关键思想：[...]
   - 优缺点：[...]

比较：[表格或分析]

模式B：随时间演变

历史背景：
- 2017：基础工作[论文1]
- 2019：第一次改进[论文2]
- 2021：突破[论文3]
- 2023：技术发展[论文4]

趋势：[进步方向]

模式C：问题-解决方案映射

问题：[研究问题]

尝试的解决方案：
- 解决方案1：[论文] - [有效性]
- 解决方案2：[论文] - [有效性]

最佳解决方案：[建议]

细化模式

细化1：范围太广

症状：搜索返回100+篇论文，压倒性

修复：缩小研究问题

代理：“最初的搜索太宽泛（找到150篇论文）。

让我们缩小一下。哪个方面最重要？
A) 特定技术（例如，只有记忆库）
B) 特定用例（例如，只有长文档）
C) 特定性能指标（例如，只有速度）
D) 特定时间段（例如，仅2023-2024）

选择一个将减少到~10-20篇论文。”

细化2：论文不够

症状：搜索返回<3篇论文

修复：扩大搜索

代理：“只找到2篇论文 - 太窄。让我们扩大：

选项A：包括相关概念（记忆→注意力）
选项B：扩大时间范围（1年→3年）
选项C：增加更多来源（添加网络搜索）
选项D：放松关键词匹配（语义搜索）

哪种方法？”

细化3：论文不相关

症状：下载的论文与研究目标不匹配

修复：细化关键词并重新搜索

代理：“这些论文没有很好地解决研究问题。

看看我们得到了什么与我们想要的：
- 得到：一般注意力论文
- 想要：特定记忆机制

让我细化搜索查询：
- 添加：'记忆扩展'，'上下文增强'
- 移除：'注意力'（太通用）
- 过滤器：摘要中必须提及'记忆'

正在运行细化搜索...”

细化4：综合太分散

症状：发现无法连接成连贯的叙述

修复：按主题重组

代理：“发现太分散了。让我按主题重组：

不是逐篇论文，而是按：
- 主题1：架构方法
- 主题2：性能权衡
- 主题3：实施考虑

每个主题将综合多篇论文的发现。

现在重组...”

细化5：缺少关键背景

症状：报告缺乏基础背景

修复：增加专注的历史搜索

代理：“这份报告需要更多关于基础的背景。

运行针对性搜索：
- 原始变压器论文（基础）
- 早期记忆工作（上下文）
- 关键调查（概述）

向报告背景添加2-3篇基础论文...”

故障排除

问题	快速修复
搜索太慢	减少来源，只关注ArXiv
论文无法下载	检查URL，使用替代来源
处理时间过长	排队耐心等待，或先阅读摘要
找不到特定论文	使用精确标题搜索
太多低质量论文	增加引用阈值>50
缺少实施细节	添加网络搜索博客帖子
报告太长	只关注前3种方法
报告太技术性	添加“简单解释”到综合
差距仍然存在	接受限制，在报告中注明
跟踪进度丢失	使用待办事项列表，检查每个阶段

高级：研究报告模板

标准报告结构：

# [研究主题]

**研究日期**：[date]
**分析论文**：[count]
**来源**：ArXiv, Semantic Scholar, 库藏

## 研究问题

[清晰，具体的问题]

## 方法论

- **搜索策略**：[关键词，来源]
- **选择标准**：[使用的过滤器]
- **审查论文**：[count和选择逻辑]

## 执行摘要

[2-3段落的发现概述]

## 关键发现

### 发现1：[标题]
[描述，支持论文]

### 发现2：[标题]
[描述，支持论文]

## 详细分析

### 方法1：[名称]

**关键论文**：[citations]
**核心思想**：[解释]
**技术细节**：[架构/方法]
**结果**：[性能数字]
**优点**：[优势]
**缺点**：[限制]

[重复每种方法]

## 权衡&比较

| 方面 | 方法1 | 方法2 | 方法3 |
|--------|-----------|------------|------------|
| 速度 | 快 | 中等 | 慢 |
| 准确性 | 高 | 中等 | 最高 |
| 内存 | 低 | 中等 | 高 |
| 复杂性 | 简单 | 中等 | 复杂 |

**建议**：[何时使用]

## 实施建议

1. **对于生产使用**：[方法+理由]
2. **对于研究**：[方法+理由]
3. **对于原型制作**：[方法+理由]

## 开放问题&未来工作

- [差距1]
- [差距2]
- [差距3]

## 结论

[发现和建议的总结]

## 参考文献

1. [论文1 - 完整引用链接]
2. [论文2 - 完整引用链接]
...

## 附录：搜索细节

- **使用的搜索查询**：[list]
- **排除的论文**：[count和原因]
- **处理笔记**：[任何问题]

总结：代理的心理模型

核心工作流程：

从宽泛开始，细化到具体研究问题
计划多源策略（发现+库藏+网络）
撒大网，然后按相关性过滤
下载&排队论文（并行处理）
系统性地阅读一切
按主题/方法综合（而不是按论文）
检查差距，如有需要进行迭代
创建全面的Markdown报告

关键原则：

迭代细化：从宽泛→狭窄→专注
多源：不要依赖单一来源
质量优于数量：5篇好论文>20篇平庸论文
系统性分析：从每个来源提取关键信息
主题基础综合：按概念分组，而不是按论文
差距意识：知道何时搜索更多
可操作输出：报告包括建议

成功指标：用户对研究主题有全面的理解，并有详细的报告可以参考/分享。