name: research-lookup description: “使用Parallel Chat API(主)或Perplexity sonar-pro-search(学术论文搜索)查找当前研究信息。自动路由查询到最佳后端。用于查找论文、收集研究数据和验证科学信息。” allowed-tools: [读取, 写入, 编辑, Bash]
研究信息查找
概述
本技能提供实时研究信息查找,具有智能后端路由:
- Parallel Chat API (
core模型):所有一般研究查询的默认后端。通过OpenAI兼容的Chat API在https://api.parallel.ai提供全面的多源研究报告,带有内联引用。 - Perplexity sonar-pro-search(通过OpenRouter):仅用于学术论文搜索,当学术数据库访问至关重要时。
技能自动检测查询类型并路由到最佳后端。
何时使用此技能
使用此技能当需要:
- 当前研究信息:最新研究、论文和发现
- 文献验证:根据当前研究检查事实、统计或主张
- 背景研究:为科学写作收集背景和支持证据
- 引用来源:查找相关论文和研究进行引用
- 技术文档:查找规格、协议或方法论
- 市场/行业数据:当前统计、趋势、竞争情报
- 最新发展:新兴趋势、突破、公告
使用科学示意图增强视觉效果
使用此技能创建文档时,始终考虑添加科学图表和示意图以增强视觉交流。
如果文档不包含示意图或图表:
- 使用scientific-schematics技能生成AI驱动的出版质量图表
- 只需用自然语言描述所需图表
python scripts/generate_schematic.py "your diagram description" -o figures/output.png
自动后端选择
技能根据内容自动路由查询到最佳后端:
路由逻辑
查询到达
|
+-- 包含学术关键词?(papers、DOI、journal、peer-reviewed等)
| 是 --> Perplexity sonar-pro-search(学术搜索模式)
|
+-- 其他一切(一般研究、市场数据、技术信息、分析)
--> Parallel Chat API(core模型)
学术关键词(路由到Perplexity)
包含这些术语的查询被路由到Perplexity进行学术重点搜索:
- 论文查找:
find papers、find articles、research papers on、published studies - 引用:
cite、citation、doi、pubmed、pmid - 学术来源:
peer-reviewed、journal article、scholarly、arxiv、preprint - 综述类型:
systematic review、meta-analysis、literature search - 论文质量:
foundational papers、seminal papers、landmark papers、highly cited
其他一切(路由到Parallel)
所有其他查询转到Parallel Chat API(core模型),包括:
- 一般研究问题
- 市场和行业分析
- 技术信息和文档
- 当前事件和最新发展
- 比较分析
- 统计数据检索
- 复杂分析查询
手动覆盖
可以强制特定后端:
# 强制Parallel深度研究
python research_lookup.py "your query" --force-backend parallel
# 强制Perplexity学术搜索
python research_lookup.py "your query" --force-backend perplexity
核心能力
1. 一般研究查询(Parallel Chat API)
默认后端。 通过Chat API(core模型)提供全面的多源研究和引用。
查询示例:
- "Recent advances in CRISPR gene editing 2025"
- "Compare mRNA vaccines vs traditional vaccines for cancer treatment"
- "AI adoption in healthcare industry statistics"
- "Global renewable energy market trends and projections"
- "Explain the mechanism underlying gut microbiome and depression"
响应包括:
- 全面的Markdown研究报告
- 来自权威网络来源的内联引用
- 带关键发现的结构化部分
- 多个视角和数据点
- 用于验证的来源URL
2. 学术论文搜索(Perplexity sonar-pro-search)
用于学术特定查询。 优先考虑学术数据库和同行评审来源。
查询示例:
- "Find papers on transformer attention mechanisms in NeurIPS 2024"
- "Foundational papers on quantum error correction"
- "Systematic review of immunotherapy in non-small cell lung cancer"
- "Cite the original BERT paper and its most influential follow-ups"
- "Published studies on CRISPR off-target effects in clinical trials"
响应包括:
- 学术文献关键发现总结
- 5-8个高质量引用,含作者、标题、期刊、年份、DOI
- 引用计数和场所层级指示
- 关键统计和方法论亮点
- 研究差距和未来方向
3. 技术和方法论信息
查询示例:
- "Western blot protocol for protein detection"
- "Statistical power analysis for clinical trials"
- "Machine learning model evaluation metrics comparison"
4. 统计和市场数据
查询示例:
- "Prevalence of diabetes in US population 2025"
- "Global AI market size and growth projections"
- "COVID-19 vaccination rates by country"
论文质量和流行度优先级
关键: 搜索论文时,始终优先考虑高质量、有影响力的论文。
基于引用的排名
| 论文年限 | 引用阈值 | 分类 |
|---|---|---|
| 0-3年 | 20+ 引用 | 值得注意 |
| 0-3年 | 100+ 引用 | 高度有影响力 |
| 3-7年 | 100+ 引用 | 显著 |
| 3-7年 | 500+ 引用 | 里程碑论文 |
| 7+年 | 500+ 引用 | 开创性工作 |
| 7+年 | 1000+ 引用 | 基础性 |
场所质量层级
层级1 - 顶级场所(始终优先):
- 通用科学:Nature、Science、Cell、PNAS
- 医学:NEJM、Lancet、JAMA、BMJ
- 领域特定:Nature Medicine、Nature Biotechnology、Nature Methods
- 顶级CS/AI:NeurIPS、ICML、ICLR、ACL、CVPR
层级2 - 高影响力专业化(强烈偏好):
- 影响因子>10的期刊
- 子领域的顶级会议(EMNLP、NAACL、ECCV、MICCAI)
层级3 - 受人尊敬的专业化(相关时包括):
- 影响因子5-10的期刊
技术集成
环境变量
# 主后端(Parallel Chat API)- 必需
export PARALLEL_API_KEY="your_parallel_api_key"
# 学术搜索后端(Perplexity)- 学术查询必需
export OPENROUTER_API_KEY="your_openrouter_api_key"
API规格
Parallel Chat API:
- 端点:
https://api.parallel.ai(OpenAI SDK兼容) - 模型:
core(60秒-5分钟延迟,复杂多源合成) - 输出:带内联引用的Markdown文本
- 引用:带有URL、推理和置信水平的研究基础
- 速率限制:300次请求/分钟
- Python包:
openai
Perplexity sonar-pro-search:
- 模型:
perplexity/sonar-pro-search(通过OpenRouter) - 搜索模式:学术(优先考虑同行评审来源)
- 搜索上下文:高(全面研究)
- 响应时间:5-15秒
命令行使用
# 自动路由研究(推荐)- 始终保存到sources/
python research_lookup.py "your query" -o sources/research_YYYYMMDD_HHMMSS_<topic>.md
# 强制特定后端 - 始终保存到sources/
python research_lookup.py "your query" --force-backend parallel -o sources/research_<topic>.md
python research_lookup.py "your query" --force-backend perplexity -o sources/papers_<topic>.md
# JSON输出 - 始终保存到sources/
python research_lookup.py "your query" --json -o sources/research_<topic>.json
# 批量查询 - 始终保存到sources/
python research_lookup.py --batch "query 1" "query 2" "query 3" -o sources/batch_research_<topic>.md
强制:所有结果保存到Sources文件夹
每个研究查找结果必须保存到项目的sources/文件夹。
这是不可协商的。研究结果获取成本高且对可重复性至关重要。
保存规则
| 后端 | -o 标志目标 |
文件名模式 |
|---|---|---|
| Parallel深度研究 | sources/research_<topic>.md |
research_YYYYMMDD_HHMMSS_<brief_topic>.md |
| Perplexity(学术) | sources/papers_<topic>.md |
papers_YYYYMMDD_HHMMSS_<brief_topic>.md |
| 批量查询 | sources/batch_<topic>.md |
batch_research_YYYYMMDD_HHMMSS_<brief_topic>.md |
如何保存
关键:每次调用research_lookup.py必须包括指向sources/文件夹的-o标志。
关键:保存的文件必须保留所有引用、来源URL和DOI。 默认文本输出自动包括Sources部分(含每个来源的标题、日期、URL)和Additional References部分(含从响应文本提取的DOI和学术URL)。对于最大引用元数据,使用--json。
# 一般研究 - 保存到sources/(包括Sources + Additional References部分)
python research_lookup.py "Recent advances in CRISPR gene editing 2025" \
-o sources/research_20250217_143000_crispr_advances.md
# 学术论文搜索 - 保存到sources/(包括论文引用和DOI)
python research_lookup.py "Find papers on transformer attention mechanisms in NeurIPS 2024" \
-o sources/papers_20250217_143500_transformer_attention.md
# JSON格式用于最大引用元数据(完整引用对象,含URL、DOI、片段)
python research_lookup.py "CRISPR clinical trials" --json \
-o sources/research_20250217_143000_crispr_trials.json
# 强制后端 - 保存到sources/
python research_lookup.py "AI regulation landscape" --force-backend parallel \
-o sources/research_20250217_144000_ai_regulation.md
# 批量查询 - 保存到sources/
python research_lookup.py --batch "mRNA vaccines efficacy" "mRNA vaccines safety" \
-o sources/batch_research_20250217_144500_mrna_vaccines.md
保存文件中的引用保留
每种输出格式以不同方式保留引用:
| 格式 | 包含的引用 | 何时使用 |
|---|---|---|
| 文本(默认) | Sources (N):部分,含[title] (date) + URL + Additional References (N):含DOI和学术URL |
标准使用 - 人类可读,包含所有引用 |
JSON(--json) |
完整引用对象:url、title、date、snippet、doi、type |
当需要最大引用元数据时 |
对于Parallel后端,保存的文件包括:研究报告 + 来源列表(标题、URL)+ 额外引用(DOI、学术URL)。 对于Perplexity后端,保存的文件包括:学术总结 + 来源列表(标题、日期、URL、片段)+ 额外引用(DOI、学术URL)。
使用--json当需要:
- 以编程方式解析引用元数据
- 为BibTeX生成保留完整DOI和URL数据
- 维护结构化引用对象以进行交叉引用
为什么保存所有内容
- 可重复性:每个引用和主张可以追溯到原始研究来源
- 上下文窗口恢复:如果上下文被压缩,保存的结果可以重新阅读而无需重新查询
- 审计跟踪:
sources/文件夹记录如何收集所有研究信息 - 跨部分重用:多个部分可以引用相同的保存研究而无需重复查询
- 成本效率:在发出新API调用前,检查
sources/中的现有结果 - 同行评审支持:评审员可以验证每个引用的研究支持
发出新查询前,先检查Sources
在调用research_lookup.py之前,检查是否已存在相关结果:
ls sources/ # 检查已保存的结果
如果先前的查找涵盖相同主题,重新阅读保存的文件而不是发出新API调用。
日志记录
保存研究结果时,始终记录:
[HH:MM:SS] SAVED: Research lookup to sources/research_20250217_143000_crispr_advances.md (3,800 words, 8 citations)
[HH:MM:SS] SAVED: Paper search to sources/papers_20250217_143500_transformer_attention.md (6 papers found)
与科学写作集成
此技能通过以下方式增强科学写作:
- 文献综述支持:为引言和讨论收集当前研究 - 保存到
sources/ - 方法验证:根据当前标准验证协议 - 保存到
sources/ - 结果上下文化:将发现与最近的类似研究比较 - 保存到
sources/ - 讨论增强:用最新证据支持论点 - 保存到
sources/ - 引用管理:提供正确格式的引用 - 保存到
sources/
补充工具
| 任务 | 工具 |
|---|---|
| 一般网络搜索 | parallel-web技能(parallel_web.py search) |
| 引用验证 | parallel-web技能(parallel_web.py extract) |
| 深度研究(任何主题) | research-lookup或parallel-web技能 |
| 学术论文搜索 | research-lookup(自动路由到Perplexity) |
| Google Scholar搜索 | citation-management技能 |
| PubMed搜索 | citation-management技能 |
| DOI到BibTeX | citation-management技能 |
| 元数据验证 | parallel-web技能(parallel_web.py search或extract) |
错误处理和限制
已知限制:
- Parallel Chat API(core模型):复杂查询可能长达5分钟
- Perplexity:信息截止,可能无法访问付费墙后的全文
- 两者:无法访问专有或受限制的数据库
后备行为:
- 如果选定后端的API密钥缺失,尝试其他后端
- 如果两个后端都失败,返回结构化错误响应
- 如果初始响应不足,重新表述查询以获得更好结果
使用示例
示例1:一般研究(路由到Parallel)
查询:“Recent advances in transformer attention mechanisms 2025”
后端:Parallel Chat API(core模型)
响应:全面的Markdown报告,带有来自权威来源的引用,涵盖最近论文、关键创新和性能基准。
示例2:学术论文搜索(路由到Perplexity)
查询:“Find papers on CRISPR off-target effects in clinical trials”
后端:Perplexity sonar-pro-search(学术模式)
响应:精选列表,含5-8个高影响力论文,完整引用、DOI、引用计数和场所层级指示。
示例3:比较分析(路由到Parallel)
查询:“Compare and contrast mRNA vaccines vs traditional vaccines for cancer treatment”
后端:Parallel Chat API(core模型)
响应:详细比较报告,含来自多个来源的数据、结构化分析和引用证据。
示例4:市场数据(路由到Parallel)
查询:“Global AI adoption in healthcare statistics 2025”
后端:Parallel Chat API(core模型)
响应:当前市场数据、采用率、增长预测和区域分析,带有来源引用。
总结
此技能作为主要研究接口,具有智能双后端路由:
- Parallel Chat API(默认,
core模型):任何主题的全面多源研究 - Perplexity sonar-pro-search:仅用于学术特定论文搜索
- 自动路由:检测学术查询并适当路由
- 手动覆盖:需要时强制任何后端
- 补充:与
parallel-web技能一起工作,用于网络搜索和URL提取