深度研究与文献综合Skill deep-research

这是一个用于对学术研究论文进行深度分析、跨文献综合和生成全面文献综述的专业技能。它提供了一套完整的工具链,包括全文阅读、引文网络分析、论文质量评估、多源信息综合等功能,帮助研究人员、学者和学生高效地进行文献调研、比较分析和知识发现。 关键词:文献综述,论文分析,引文网络,研究综合,学术研究,文献调研,知识发现,跨论文分析,深度阅读,研究工具

文献检索 48 次安装 957 次浏览 更新于 2/26/2026

name: deep-research description: 对研究论文进行深度分析,综合文献,并生成全面的综述。当用户需要进行深入的论文分析、文献综述或跨论文综合时使用。 tools:

  • read_full_article
  • unload_article
  • answer_research_question
  • explore_citation_network
  • compare_articles
  • find_related_papers
  • evaluate_article
  • get_citation_context
  • search_articles
  • get_article_details
  • search_external_knowledge
  • list_knowledge_collections

深度研究与文献综合

对研究论文进行深入分析,综合多个来源的发现,并生成全面的文献综述。利用研究论文和外部知识(教科书、背景材料)以获得完整的理解。

使用的工具

对于深度研究,使用以下分析工具:

工具 用途
read_full_article 阅读完整文章内容以进行深度学习
unload_article 释放文章内存槽(最多3篇文章)
answer_research_question 带引用的多源综合(支持范围过滤)
explore_citation_network 引文网络分析
compare_articles 并排比较
find_related_papers 语义相似性
evaluate_article 质量评分
get_citation_context 引文关系上下文
search_articles 在知识库中查找论文
get_article_details 获取文章元数据和预览
search_external_knowledge 搜索教科书和背景材料
list_knowledge_collections 显示可用的外部知识集合

注意:这些是分析密集型工具。对于更简单的查询,请改用 knowledge-base-qa 技能。

文章内存限制

关键:您一次最多只能将 3 篇文章 加载到工作内存中。

  • 使用 read_full_article(article_identifier="...", agent_id="your_agent_id") 加载文章
  • 每次加载消耗一个内存槽(加载后显示状态)
  • 当内存已满(3/3)时,在加载新文章之前使用 unload_article
  • 使用 unload_article(article_identifier="...", agent_id="your_agent_id") 释放槽位

深度研究工作流程:在分析多篇论文时,策略性地加载和卸载文章:

  1. 初始加载3篇关键论文
  2. 分析并提取见解
  3. 卸载已完成分析的论文
  4. 加载新论文以填补知识空白
  5. 重复直到综合完成

迭代学习模式

关键原则:您可以阅读、从文章中学习,并继续阅读以建立深入的理解。在3篇文章的内存限制下,策略性地管理您加载的文章。在深入研究论文之前,先从教科书中获取基础知识。

学习循环

0. 基础(如果需要):获取背景理解
   list_knowledge_collections()
   search_external_knowledge(
     query="基础概念",
     collection_name="相关教科书集合"
   )
   → 首先建立理论基础

1. 发现:搜索相关论文
   search_articles(query="主题")

2. 深度阅读:加载完整的文章内容(一次最多3篇)
   read_full_article(
     article_identifier="论文标题或DOI",
     agent_id="your_agent_id"
   )
   → 阅读整篇文章,不仅仅是预览
   → 状态显示:"文章内存:已使用 2/3 个槽位"

3. 分析:提取关键见解
   - 主要贡献是什么?
   - 使用了什么方法?
   - 局限性是什么?

4. 识别空白:哪些问题仍然存在?
   - 哪些概念需要澄清? → search_external_knowledge
   - 应该阅读哪些相关工作? → find_related_papers

5. 管理内存:如果需要,释放槽位
   如果您已加载3篇文章并需要阅读另一篇:
   unload_article(
     article_identifier="要卸载的标题或DOI",
     agent_id="your_agent_id"
   )

6. 重复:阅读更多文章以填补空白
   find_related_papers(article_id="...")
   read_full_article(
     article_identifier="下一篇论文",
     agent_id="your_agent_id"
   )

7. 综合:跨论文整合见解
   answer_research_question(
     question="综合查询",
     scope="all"  # 包括论文和外部知识
   )

何时阅读全文

使用 read_full_article 当:

  • 您需要理解方法细节时
  • 预览(来自 get_article_details)不够时
  • 您正在跨论文比较特定技术时
  • 您正在撰写文献综述时
  • 您想深入学习某个主题时

使用 get_article_details 当:

  • 您只需要元数据(作者、日期、期刊)时
  • 您正在进行论文的初步筛选时
  • 快速预览就足够时

内存提示:加载您将主动分析的文章。当需要加载新文章时,使用 unload_article 换出已完成分析的论文。

外部内容

对于知识库之外的网络文章、博客文章和文档:

  • 使用 Letta 内置的 fetch_webpage 工具来读取外部 URL
  • 这补充了用于索引论文的 read_full_article

何时使用此技能

当用户要求以下内容时使用深度研究:

  • “深入分析这篇论文”
  • “比较这些论文”
  • “撰写关于 X 的文献综述”
  • “X 领域的研究空白是什么?”
  • “综合关于 X 的跨论文发现”
  • “关于 X 的研究是如何演变的?”

深度分析工作流程

单篇论文深度分析

1. 阅读完整的文章内容
   read_full_article(
     article_identifier="[论文标题或DOI]",
     agent_id="your_agent_id"
   )
   → 返回完整的 Markdown 内容以供深度阅读

2. 探索引文上下文
   explore_citation_network(
     article_id="[论文ID]",
     direction="both",  # 被引用和参考文献
     depth=1
   )

3. 评估质量
   evaluate_article(
     article_id="[论文ID]",
     criteria=["新颖性", "方法论", "影响力"]
   )

4. 如果您有问题,请阅读相关论文
   find_related_papers(article_id="[论文ID]")

   # 如果内存已满(3/3),先卸载一篇
   unload_article(
     article_identifier="[要移除的文章]",
     agent_id="your_agent_id"
   )

   # 然后加载新文章
   read_full_article(
     article_identifier="[相关论文]",
     agent_id="your_agent_id"
   )
   → 继续阅读直到理解该主题

多篇论文比较

1. 确定要比较的论文
   search_articles(query="[主题]", limit=10)

2. 运行比较
   compare_articles(
     article_ids=["paper1", "paper2", "paper3"],
     comparison_aspects=["方法论", "结果", "数据集", "局限性"]
   )

3. 查找其他相关工作
   find_related_papers(article_id="[种子论文]", limit=10)

文献综合

1. 通过综合回答研究问题
   answer_research_question(
     question="[主题问题]",
     max_sources=20,
     min_relevance=0.7
   )
   → 返回来自知识库的带引用的全面答案

2. 探索引文关系
   explore_citation_network(
     article_id="[关键论文ID]",
     direction="both",
     depth=2
   )

分析维度

分析论文时,请考虑以下维度:

方法论评估

  • 研究设计(实验性、理论性、实证性)
  • 数据来源和质量
  • 评估指标
  • 可重复性指标

贡献分析

  • 引入的新技术/方法
  • 相对于先前工作的改进
  • 实际应用
  • 理论见解

局限性与空白

  • 已承认的局限性
  • 隐含的假设
  • 缺失的比较
  • 未来工作方向

影响力评估

  • 引用次数/趋势
  • 在后续工作中的采用情况
  • 行业应用
  • 社区认可度

委派模式

当出现以下情况时,协调员应委派给研究分析师:

  • 用户明确请求深度分析
  • 问题需要阅读全文
  • 需要比较 3 篇以上论文
  • 请求文献综述

委派消息格式

send_message_to_agent(
  agent_name="Research Analyst",
  message="深度分析请求:[具体任务]

  要分析的论文:[ID 或标题列表]

  重点领域:[方法论/结果/局限性等]

  所需输出:[比较表/摘要/综述等]"
)

工作流程示例

示例 1:单篇论文深度分析

用户:“深入分析 ‘Attention Is All You Need’ 这篇论文”

1. read_full_article(
     article_identifier="Attention Is All You Need",
     agent_id="your_agent_id"
   )
   → 阅读完整的论文内容
   → 状态:"文章内存:已使用 1/3 个槽位"

2. [彻底阅读并理解论文]
   - 记录关键贡献、方法论、结果

3. explore_citation_network(
     article_id="[论文ID]",
     direction="cited_by",
     depth=1
   )

4. 如果概念不清楚,请阅读相关论文:
   # 最多再加载 2 篇文章(总共最多 3 篇)
   read_full_article(
     article_identifier="[关于注意力的相关论文]",
     agent_id="your_agent_id"
   )
   → 状态:"文章内存:已使用 2/3 个槽位"
   → 继续学习直到理解

   # 如果您需要第 4 篇文章,请先卸载一篇
   unload_article(
     article_identifier="[第一篇论文]",
     agent_id="your_agent_id"
   )
   read_full_article(
     article_identifier="[第4篇论文]",
     agent_id="your_agent_id"
   )

5. evaluate_article(
     article_id="[论文ID]",
     criteria=["新颖性", "方法论", "影响力"]
   )

6. 响应:
   "## 深度分析:Attention Is All You Need

   **核心贡献**:[Transformer 架构描述]

   **方法论**:
   - 自注意力机制
   - 位置编码方法
   - 训练过程

   **关键结果**:
   - BLEU 分数改进
   - 训练效率提升

   **影响力分析**:
   - [X] 次引用
   - 催生了:BERT、GPT、T5 等。

   **研究脉络**:
   - 建立在:[来自引文网络的参考文献]
   - 影响了:[高被引论文]"

示例 2:比较分析

用户:“比较 GPT-4、Claude 和 Llama 3 的架构”

1. search_articles(query="GPT-4 架构", limit=3)
   search_articles(query="Claude 架构 Anthropic", limit=3)
   search_articles(query="Llama 3 架构", limit=3)

2. compare_articles(
     article_ids=[每个的论文ID],
     comparison_aspects=[
       "模型大小",
       "训练数据",
       "架构创新",
       "基准性能",
       "安全措施"
     ]
   )

3. 响应:
   "## 比较分析:GPT-4 vs Claude vs Llama 3

   | 方面 | GPT-4 | Claude | Llama 3 |
   |--------|-------|--------|---------|
   | 大小 | ... | ... | ... |
   | 训练 | ... | ... | ... |
   | 关键创新 | ... | ... | ... |

   **主要差异**:
   1. [差异 1]
   2. [差异 2]

   **共同方法**:
   - [共同点]

   **文献中的显著空白**:
   - [未充分记录的内容]"

示例 3:文献综述

用户:“给我一份关于高效 Transformer 的文献综述”

1. answer_research_question(
     question="使 Transformer 更高效的主要方法有哪些?",
     max_sources=25
   )
   → 返回带引用的全面综合

2. search_articles(query="高效 Transformer", limit=20)
   → 在知识库中查找关键论文

3. 对于关键论文,探索引用:
   explore_citation_network(article_id="[关键论文]", direction="both")

4. 响应:
   "## 文献综述:高效 Transformer

   ### 1. 引言
   [来自 answer_research_question 的背景和重要性]

   ### 2. 方法分类

   **2.1 注意力近似**
   - 线性注意力 [引用]
   - 稀疏注意力 [引用]
   - 低秩近似 [引用]

   **2.2 架构修改**
   - 状态空间模型 [引用]
   - 专家混合 [引用]

   **2.3 实现优化**
   - FlashAttention [引用]
   - 内存高效注意力 [引用]

   ### 3. 引文分析
   [来自 explore_citation_network 的关键论文及其关系]

   ### 4. 研究空白
   [从综合中识别出的空白]

   ### 参考文献
   [来自 answer_research_question 的引用]"

质量标准

对于深度研究输出:

  1. 准确性:每个主张都有引用支持
  2. 全面性:涵盖主要方法/论文
  3. 结构:清晰的章节组织
  4. 平衡性:公平地呈现多种观点
  5. 时效性:包括近期工作(过去2年)
  6. 空白:识别文献中缺失的内容