name: research-lookup description: “使用Parallel Chat API（主）或Perplexity sonar-pro-search（学术论文搜索）查找当前研究信息。自动路由查询到最佳后端。用于查找论文、收集研究数据和验证科学信息。” allowed-tools: [读取, 写入, 编辑, Bash]

研究信息查找

概述

本技能提供实时研究信息查找，具有智能后端路由：

Parallel Chat API (core 模型)：所有一般研究查询的默认后端。通过OpenAI兼容的Chat API在https://api.parallel.ai提供全面的多源研究报告，带有内联引用。
Perplexity sonar-pro-search（通过OpenRouter）：仅用于学术论文搜索，当学术数据库访问至关重要时。

技能自动检测查询类型并路由到最佳后端。

何时使用此技能

使用此技能当需要：

当前研究信息：最新研究、论文和发现
文献验证：根据当前研究检查事实、统计或主张
背景研究：为科学写作收集背景和支持证据
引用来源：查找相关论文和研究进行引用
技术文档：查找规格、协议或方法论
市场/行业数据：当前统计、趋势、竞争情报
最新发展：新兴趋势、突破、公告

使用科学示意图增强视觉效果

使用此技能创建文档时，始终考虑添加科学图表和示意图以增强视觉交流。

如果文档不包含示意图或图表：

使用scientific-schematics技能生成AI驱动的出版质量图表
只需用自然语言描述所需图表

python scripts/generate_schematic.py "your diagram description" -o figures/output.png

自动后端选择

技能根据内容自动路由查询到最佳后端：

路由逻辑

查询到达
    |
    +-- 包含学术关键词？（papers、DOI、journal、peer-reviewed等）
    |       是 --> Perplexity sonar-pro-search（学术搜索模式）
    |
    +-- 其他一切（一般研究、市场数据、技术信息、分析）
             --> Parallel Chat API（core模型）

学术关键词（路由到Perplexity）

包含这些术语的查询被路由到Perplexity进行学术重点搜索：

论文查找：find papers、find articles、research papers on、published studies
引用：cite、citation、doi、pubmed、pmid
学术来源：peer-reviewed、journal article、scholarly、arxiv、preprint
综述类型：systematic review、meta-analysis、literature search
论文质量：foundational papers、seminal papers、landmark papers、highly cited

其他一切（路由到Parallel）

所有其他查询转到Parallel Chat API（core模型），包括：

一般研究问题
市场和行业分析
技术信息和文档
当前事件和最新发展
比较分析
统计数据检索
复杂分析查询

手动覆盖

可以强制特定后端：

# 强制Parallel深度研究
python research_lookup.py "your query" --force-backend parallel

# 强制Perplexity学术搜索
python research_lookup.py "your query" --force-backend perplexity

核心能力

1. 一般研究查询（Parallel Chat API）

默认后端。 通过Chat API（core模型）提供全面的多源研究和引用。

查询示例：
- "Recent advances in CRISPR gene editing 2025"
- "Compare mRNA vaccines vs traditional vaccines for cancer treatment"
- "AI adoption in healthcare industry statistics"
- "Global renewable energy market trends and projections"
- "Explain the mechanism underlying gut microbiome and depression"

响应包括：

全面的Markdown研究报告
来自权威网络来源的内联引用
带关键发现的结构化部分
多个视角和数据点
用于验证的来源URL

2. 学术论文搜索（Perplexity sonar-pro-search）

用于学术特定查询。 优先考虑学术数据库和同行评审来源。

查询示例：
- "Find papers on transformer attention mechanisms in NeurIPS 2024"
- "Foundational papers on quantum error correction"
- "Systematic review of immunotherapy in non-small cell lung cancer"
- "Cite the original BERT paper and its most influential follow-ups"
- "Published studies on CRISPR off-target effects in clinical trials"

响应包括：

学术文献关键发现总结
5-8个高质量引用，含作者、标题、期刊、年份、DOI
引用计数和场所层级指示
关键统计和方法论亮点
研究差距和未来方向

3. 技术和方法论信息

查询示例：
- "Western blot protocol for protein detection"
- "Statistical power analysis for clinical trials"
- "Machine learning model evaluation metrics comparison"

4. 统计和市场数据

查询示例：
- "Prevalence of diabetes in US population 2025"
- "Global AI market size and growth projections"
- "COVID-19 vaccination rates by country"

论文质量和流行度优先级

关键： 搜索论文时，始终优先考虑高质量、有影响力的论文。

基于引用的排名

论文年限	引用阈值	分类
0-3年	20+ 引用	值得注意
0-3年	100+ 引用	高度有影响力
3-7年	100+ 引用	显著
3-7年	500+ 引用	里程碑论文
7+年	500+ 引用	开创性工作
7+年	1000+ 引用	基础性

场所质量层级

层级1 - 顶级场所（始终优先）：

通用科学：Nature、Science、Cell、PNAS
医学：NEJM、Lancet、JAMA、BMJ
领域特定：Nature Medicine、Nature Biotechnology、Nature Methods
顶级CS/AI：NeurIPS、ICML、ICLR、ACL、CVPR

层级2 - 高影响力专业化（强烈偏好）：

影响因子>10的期刊
子领域的顶级会议（EMNLP、NAACL、ECCV、MICCAI）

层级3 - 受人尊敬的专业化（相关时包括）：

影响因子5-10的期刊

技术集成

环境变量

# 主后端（Parallel Chat API）- 必需
export PARALLEL_API_KEY="your_parallel_api_key"

# 学术搜索后端（Perplexity）- 学术查询必需
export OPENROUTER_API_KEY="your_openrouter_api_key"

API规格

Parallel Chat API：

端点：https://api.parallel.ai（OpenAI SDK兼容）
模型：core（60秒-5分钟延迟，复杂多源合成）
输出：带内联引用的Markdown文本
引用：带有URL、推理和置信水平的研究基础
速率限制：300次请求/分钟
Python包：openai

Perplexity sonar-pro-search：

模型：perplexity/sonar-pro-search（通过OpenRouter）
搜索模式：学术（优先考虑同行评审来源）
搜索上下文：高（全面研究）
响应时间：5-15秒

命令行使用

# 自动路由研究（推荐）- 始终保存到sources/
python research_lookup.py "your query" -o sources/research_YYYYMMDD_HHMMSS_<topic>.md

# 强制特定后端 - 始终保存到sources/
python research_lookup.py "your query" --force-backend parallel -o sources/research_<topic>.md
python research_lookup.py "your query" --force-backend perplexity -o sources/papers_<topic>.md

# JSON输出 - 始终保存到sources/
python research_lookup.py "your query" --json -o sources/research_<topic>.json

# 批量查询 - 始终保存到sources/
python research_lookup.py --batch "query 1" "query 2" "query 3" -o sources/batch_research_<topic>.md

强制：所有结果保存到Sources文件夹

每个研究查找结果必须保存到项目的sources/文件夹。

这是不可协商的。研究结果获取成本高且对可重复性至关重要。

保存规则

后端	`-o` 标志目标	文件名模式
Parallel深度研究	`sources/research_<topic>.md`	`research_YYYYMMDD_HHMMSS_<brief_topic>.md`
Perplexity（学术）	`sources/papers_<topic>.md`	`papers_YYYYMMDD_HHMMSS_<brief_topic>.md`
批量查询	`sources/batch_<topic>.md`	`batch_research_YYYYMMDD_HHMMSS_<brief_topic>.md`

如何保存

关键：每次调用research_lookup.py必须包括指向sources/文件夹的-o标志。

关键：保存的文件必须保留所有引用、来源URL和DOI。 默认文本输出自动包括Sources部分（含每个来源的标题、日期、URL）和Additional References部分（含从响应文本提取的DOI和学术URL）。对于最大引用元数据，使用--json。

# 一般研究 - 保存到sources/（包括Sources + Additional References部分）
python research_lookup.py "Recent advances in CRISPR gene editing 2025" \
  -o sources/research_20250217_143000_crispr_advances.md

# 学术论文搜索 - 保存到sources/（包括论文引用和DOI）
python research_lookup.py "Find papers on transformer attention mechanisms in NeurIPS 2024" \
  -o sources/papers_20250217_143500_transformer_attention.md

# JSON格式用于最大引用元数据（完整引用对象，含URL、DOI、片段）
python research_lookup.py "CRISPR clinical trials" --json \
  -o sources/research_20250217_143000_crispr_trials.json

# 强制后端 - 保存到sources/
python research_lookup.py "AI regulation landscape" --force-backend parallel \
  -o sources/research_20250217_144000_ai_regulation.md

# 批量查询 - 保存到sources/
python research_lookup.py --batch "mRNA vaccines efficacy" "mRNA vaccines safety" \
  -o sources/batch_research_20250217_144500_mrna_vaccines.md

保存文件中的引用保留

每种输出格式以不同方式保留引用：

格式	包含的引用	何时使用
文本（默认）	`Sources (N):`部分，含`[title] (date) + URL` + `Additional References (N):`含DOI和学术URL	标准使用 - 人类可读，包含所有引用
JSON（`--json`）	完整引用对象：`url`、`title`、`date`、`snippet`、`doi`、`type`	当需要最大引用元数据时

对于Parallel后端，保存的文件包括：研究报告 + 来源列表（标题、URL）+ 额外引用（DOI、学术URL）。 对于Perplexity后端，保存的文件包括：学术总结 + 来源列表（标题、日期、URL、片段）+ 额外引用（DOI、学术URL）。

使用--json当需要：

以编程方式解析引用元数据
为BibTeX生成保留完整DOI和URL数据
维护结构化引用对象以进行交叉引用

为什么保存所有内容

可重复性：每个引用和主张可以追溯到原始研究来源
上下文窗口恢复：如果上下文被压缩，保存的结果可以重新阅读而无需重新查询
审计跟踪：sources/文件夹记录如何收集所有研究信息
跨部分重用：多个部分可以引用相同的保存研究而无需重复查询
成本效率：在发出新API调用前，检查sources/中的现有结果
同行评审支持：评审员可以验证每个引用的研究支持

发出新查询前，先检查Sources

在调用research_lookup.py之前，检查是否已存在相关结果：

ls sources/  # 检查已保存的结果

如果先前的查找涵盖相同主题，重新阅读保存的文件而不是发出新API调用。

日志记录

保存研究结果时，始终记录：

[HH:MM:SS] SAVED: Research lookup to sources/research_20250217_143000_crispr_advances.md (3,800 words, 8 citations)
[HH:MM:SS] SAVED: Paper search to sources/papers_20250217_143500_transformer_attention.md (6 papers found)

与科学写作集成

此技能通过以下方式增强科学写作：

文献综述支持：为引言和讨论收集当前研究 - 保存到sources/
方法验证：根据当前标准验证协议 - 保存到sources/
结果上下文化：将发现与最近的类似研究比较 - 保存到sources/
讨论增强：用最新证据支持论点 - 保存到sources/
引用管理：提供正确格式的引用 - 保存到sources/

补充工具

任务	工具
一般网络搜索	`parallel-web`技能（`parallel_web.py search`）
引用验证	`parallel-web`技能（`parallel_web.py extract`）
深度研究（任何主题）	`research-lookup`或`parallel-web`技能
学术论文搜索	`research-lookup`（自动路由到Perplexity）
Google Scholar搜索	`citation-management`技能
PubMed搜索	`citation-management`技能
DOI到BibTeX	`citation-management`技能
元数据验证	`parallel-web`技能（`parallel_web.py search`或`extract`）

错误处理和限制

已知限制：

Parallel Chat API（core模型）：复杂查询可能长达5分钟
Perplexity：信息截止，可能无法访问付费墙后的全文
两者：无法访问专有或受限制的数据库

后备行为：

如果选定后端的API密钥缺失，尝试其他后端
如果两个后端都失败，返回结构化错误响应
如果初始响应不足，重新表述查询以获得更好结果

使用示例

示例1：一般研究（路由到Parallel）

查询：“Recent advances in transformer attention mechanisms 2025”

后端：Parallel Chat API（core模型）

响应：全面的Markdown报告，带有来自权威来源的引用，涵盖最近论文、关键创新和性能基准。

示例2：学术论文搜索（路由到Perplexity）

查询：“Find papers on CRISPR off-target effects in clinical trials”

后端：Perplexity sonar-pro-search（学术模式）

响应：精选列表，含5-8个高影响力论文，完整引用、DOI、引用计数和场所层级指示。

示例3：比较分析（路由到Parallel）

查询：“Compare and contrast mRNA vaccines vs traditional vaccines for cancer treatment”

后端：Parallel Chat API（core模型）

响应：详细比较报告，含来自多个来源的数据、结构化分析和引用证据。

示例4：市场数据（路由到Parallel）

查询：“Global AI adoption in healthcare statistics 2025”

后端：Parallel Chat API（core模型）

响应：当前市场数据、采用率、增长预测和区域分析，带有来源引用。

总结

此技能作为主要研究接口，具有智能双后端路由：

Parallel Chat API（默认，core模型）：任何主题的全面多源研究
Perplexity sonar-pro-search：仅用于学术特定论文搜索
自动路由：检测学术查询并适当路由
手动覆盖：需要时强制任何后端
补充：与parallel-web技能一起工作，用于网络搜索和URL提取