智能研究查找技能Skill research-lookup

这个技能提供实时研究信息查找,通过自动路由到Parallel Chat API或Perplexity sonar-pro-search后端,支持学术论文搜索和一般研究数据收集,适用于文献检索、数据验证、科研写作和市场分析。关键词:研究查找、学术搜索、文献检索、数据验证、智能路由。

文献检索 0 次安装 0 次浏览 更新于 3/22/2026

名称: research-lookup 描述: “使用Parallel Chat API(主要)或Perplexity sonar-pro-search(学术论文搜索)查找当前研究信息。自动路由查询到最佳后端。用于查找论文、收集研究数据和验证科学信息。” 允许工具: [读取, 写入, 编辑, Bash]

研究信息查找

概述

这个技能提供实时研究信息查找,具有智能后端路由

  • Parallel Chat API (core 模型):所有一般研究查询的默认后端。通过OpenAI兼容的Chat API在https://api.parallel.ai提供全面的、多源的研究报告,带有内联引用。
  • Perplexity sonar-pro-search (通过OpenRouter):仅用于学术特定的论文搜索,其中学术数据库访问至关重要。

该技能自动检测查询类型并路由到最佳后端。

何时使用此技能

当您需要时使用此技能:

  • 当前研究信息:最新研究、论文和发现
  • 文献验证:根据当前研究检查事实、统计数据或声明
  • 背景研究:为科学写作收集上下文和支持证据
  • 引用来源:查找相关论文和研究以引用
  • 技术文档:查找规范、协议或方法学
  • 市场/行业数据:当前统计数据、趋势、竞争情报
  • 最新发展:新兴趋势、突破、公告

通过科学示意图增强视觉传达

使用此技能创建文档时,始终考虑添加科学图表和示意图以增强视觉传达。

如果您的文档尚未包含示意图或图表:

  • 使用科学示意图技能生成AI驱动的出版物质量图表
  • 只需用自然语言描述您想要的图表
python scripts/generate_schematic.py "您的图表描述" -o figures/output.png

自动后端选择

该技能根据内容自动路由查询到最佳后端:

路由逻辑

查询到达
    |
    +-- 包含学术关键词?(论文、DOI、期刊、同行评审等)
    |       是 --> Perplexity sonar-pro-search (学术搜索模式)
    |
    +-- 其他所有内容 (一般研究、市场数据、技术信息、分析)
            --> Parallel Chat API (core模型)

学术关键词 (路由到Perplexity)

包含这些术语的查询被路由到Perplexity进行学术聚焦搜索:

  • 论文查找:查找论文查找文章关于...的研究论文已发表的研究
  • 引用:引用citationdoipubmedpmid
  • 学术来源:同行评审期刊文章学术的arxiv预印本
  • 评论类型:系统综述荟萃分析文献搜索
  • 论文质量:基础论文开创性论文里程碑论文高被引

其他所有内容 (路由到Parallel)

所有其他查询转到Parallel Chat API (core模型),包括:

  • 一般研究问题
  • 市场和行业分析
  • 技术信息和文档
  • 当前事件和最新发展
  • 比较分析
  • 统计数据检索
  • 复杂分析查询

手动覆盖

您可以强制使用特定后端:

# 强制Parallel深度研究
python research_lookup.py "您的查询" --force-backend parallel

# 强制Perplexity学术搜索
python research_lookup.py "您的查询" --force-backend perplexity

核心能力

1. 一般研究查询 (Parallel Chat API)

默认后端。 通过Chat API (core模型)提供全面的、多源研究,带有引用。

查询示例:
- "2025年CRISPR基因编辑的最新进展"
- "比较mRNA疫苗与传统疫苗用于癌症治疗"
- "医疗保健行业AI采用统计数据"
- "全球可再生能源市场趋势和预测"
- "解释肠道微生物组与抑郁症的机制"

响应包括:

  • 全面的研究报告,以markdown格式
  • 来自权威网络源的内联引用
  • 带有关键发现的结构化部分
  • 多个视角和数据点
  • 用于验证的源URL

2. 学术论文搜索 (Perplexity sonar-pro-search)

用于学术特定查询。 优先考虑学术数据库和同行评审来源。

查询示例:
- "查找NeurIPS 2024中关于Transformer注意力机制的论文"
- "量子纠错的基础论文"
- "非小细胞肺癌免疫疗法的系统综述"
- "引用原始BERT论文及其最有影响力的后续工作"
- "已发表的关于CRISPR脱靶效应在临床试验中的研究"

响应包括:

  • 学术文献关键发现的摘要
  • 5-8个高质量引用,包括作者、标题、期刊、年份、DOIs
  • 引用次数和场所层级指示器
  • 关键统计和方法学亮点
  • 研究差距和未来方向

3. 技术和方法学信息

查询示例:
- "蛋白质检测的Western blot协议"
- "临床试验的统计功效分析"
- "机器学习模型评估指标比较"

4. 统计和市场数据

查询示例:
- "2025年美国人口糖尿病患病率"
- "全球AI市场规模和增长预测"
- "按国家划分的COVID-19疫苗接种率"

论文质量和流行度优先

关键:当搜索论文时,始终优先考虑高质量、有影响力的论文。

基于引用的排名

论文年龄 引用阈值 分类
0-3年 20+ 引用 值得注意
0-3年 100+ 引用 高度有影响力
3-7年 100+ 引用 显著
3-7年 500+ 引用 里程碑论文
7+年 500+ 引用 开创性工作
7+年 1000+ 引用 基础性

场所质量层级

层级 1 - 首要场所 (始终优先):

  • 一般科学:Nature、Science、Cell、PNAS
  • 医学:NEJM、Lancet、JAMA、BMJ
  • 领域特定:Nature Medicine、Nature Biotechnology、Nature Methods
  • 顶级CS/AI:NeurIPS、ICML、ICLR、ACL、CVPR

层级 2 - 高影响力专业化 (强烈优先):

  • 影响因子 > 10 的期刊
  • 子领域顶级会议 (EMNLP、NAACL、ECCV、MICCAI)

层级 3 - 受尊敬的专业化 (相关时包括):

  • 影响因子 5-10 的期刊

技术集成

环境变量

# 主要后端 (Parallel Chat API) - 必需
export PARALLEL_API_KEY="您的parallel_api_key"

# 学术搜索后端 (Perplexity) - 学术查询必需
export OPENROUTER_API_KEY="您的openrouter_api_key"

API规范

Parallel Chat API:

  • 端点:https://api.parallel.ai (兼容OpenAI SDK)
  • 模型:core (60秒-5分钟延迟,复杂多源合成)
  • 输出:带有内联引用的Markdown文本
  • 引用:研究基础,带有URL、推理和置信水平
  • 速率限制:300 请求/分钟
  • Python包:openai

Perplexity sonar-pro-search:

  • 模型:perplexity/sonar-pro-search (通过OpenRouter)
  • 搜索模式:学术 (优先考虑同行评审来源)
  • 搜索上下文:高 (全面研究)
  • 响应时间:5-15秒

命令行使用

# 自动路由研究 (推荐) — 始终保存到sources/
python research_lookup.py "您的查询" -o sources/research_YYYYMMDD_HHMMSS_<主题>.md

# 强制特定后端 — 始终保存到sources/
python research_lookup.py "您的查询" --force-backend parallel -o sources/research_<主题>.md
python research_lookup.py "您的查询" --force-backend perplexity -o sources/papers_<主题>.md

# JSON输出 — 始终保存到sources/
python research_lookup.py "您的查询" --json -o sources/research_<主题>.json

# 批量查询 — 始终保存到sources/
python research_lookup.py --batch "查询1" "查询2" "查询3" -o sources/batch_research_<主题>.md

强制:将所有结果保存到源文件夹

每个research-lookup结果必须保存到项目的sources/文件夹。

这是不可协商的。研究结果获取成本高,对可重复性至关重要。

保存规则

后端 -o 标志目标 文件名模式
Parallel深度研究 sources/research_<主题>.md research_YYYYMMDD_HHMMSS_<简短主题>.md
Perplexity (学术) sources/papers_<主题>.md papers_YYYYMMDD_HHMMSS_<简短主题>.md
批量查询 sources/batch_<主题>.md batch_research_YYYYMMDD_HHMMSS_<简短主题>.md

如何保存

关键:每次调用research_lookup.py必须包括指向sources/文件夹的-o标志。

关键:保存的文件必须保留所有引用、源URL和DOIs。 默认文本输出自动包括来源部分 (每个源有标题、日期、URL) 和附加参考部分 (从响应文本中提取的DOIs和学术URL)。对于最大引用元数据,使用--json

# 一般研究 — 保存到sources/ (包括来源 + 附加参考部分)
python research_lookup.py "2025年CRISPR基因编辑的最新进展" \
  -o sources/research_20250217_143000_crispr_advances.md

# 学术论文搜索 — 保存到sources/ (包括带有DOIs的论文引用)
python research_lookup.py "查找NeurIPS 2024中关于Transformer注意力机制的论文" \
  -o sources/papers_20250217_143500_transformer_attention.md

# JSON格式用于最大引用元数据 (完整引用对象,带有URL、DOIs、片段)
python research_lookup.py "CRISPR临床试验" --json \
  -o sources/research_20250217_143000_crispr_trials.json

# 强制后端 — 保存到sources/
python research_lookup.py "AI监管格局" --force-backend parallel \
  -o sources/research_20250217_144000_ai_regulation.md

# 批量查询 — 保存到sources/
python research_lookup.py --batch "mRNA疫苗效力" "mRNA疫苗安全性" \
  -o sources/batch_research_20250217_144500_mrna_vaccines.md

保存文件中的引用保留

每种输出格式以不同方式保留引用:

格式 包含的引用 何时使用
文本 (默认) 来源 (N): 部分,带有[标题] (日期) + URL + 附加参考 (N): 带有DOIs和学术URL 标准使用 — 人类可读,带有所有引用
JSON (--json) 完整引用对象:urltitledatesnippetdoitype 当您需要最大引用元数据时

对于Parallel后端,保存的文件包括:研究报告 + 来源列表 (标题、URL) + 附加参考 (DOIs、学术URL)。 对于Perplexity后端,保存的文件包括:学术摘要 + 来源列表 (标题、日期、URL、片段) + 附加参考 (DOIs、学术URL)。

使用--json当您需要时:

  • 以编程方式解析引用元数据
  • 保留完整DOI和URL数据用于BibTeX生成
  • 维护结构化引用对象用于交叉引用

为什么保存一切

  1. 可重复性:每个引用和声明可以追溯到其原始研究源
  2. 上下文窗口恢复:如果上下文被压缩,保存的结果可以重新读取而无需重新查询
  3. 审计跟踪sources/文件夹记录所有研究信息是如何收集的
  4. 跨部分重用:多个部分可以引用相同的保存研究,而无需重复查询
  5. 成本效率:在做出新的API调用之前检查sources/以获取现有结果
  6. 同行评审支持:审稿人可以验证每个引用的研究支持

在做出新查询之前,首先检查源

在调用research_lookup.py之前,检查是否已存在相关结果:

ls sources/  # 检查现有保存结果

如果先前的查找覆盖了相同主题,重新读取保存的文件而不是进行新的API调用。

日志记录

保存研究结果时,始终记录:

[HH:MM:SS] 保存:研究查找到sources/research_20250217_143000_crispr_advances.md (3,800字,8引用)
[HH:MM:SS] 保存:论文搜索到sources/papers_20250217_143500_transformer_attention.md (找到6篇论文)

与科学写作集成

此技能通过提供以下内容增强科学写作:

  1. 文献综述支持:为引言和讨论收集当前研究 — 保存到sources/
  2. 方法验证:根据当前标准验证协议 — 保存到sources/
  3. 结果语境化:将发现与近期类似研究比较 — 保存到sources/
  4. 讨论增强:用最新证据支持论点 — 保存到sources/
  5. 引用管理:提供正确格式的引用 — 保存到sources/

互补工具

任务 工具
一般网络搜索 parallel-web 技能 (parallel_web.py search)
引用验证 parallel-web 技能 (parallel_web.py extract)
深度研究 (任何主题) research-lookupparallel-web 技能
学术论文搜索 research-lookup (自动路由到Perplexity)
Google Scholar搜索 citation-management 技能
PubMed搜索 citation-management 技能
DOI到BibTeX citation-management 技能
元数据验证 parallel-web 技能 (parallel_web.py searchextract)

错误处理和限制

已知限制:

  • Parallel Chat API (core模型):复杂查询可能需要长达5分钟
  • Perplexity:信息截止,可能无法访问付费墙后的全文
  • 两者:无法访问专有或受限数据库

回退行为:

  • 如果所选后端的API密钥缺失,尝试其他后端
  • 如果两个后端都失败,返回结构化错误响应
  • 如果初始响应不足,重新表述查询以获得更好结果

使用示例

示例1:一般研究 (路由到Parallel)

查询:“2025年Transformer注意力机制的最新进展”

后端:Parallel Chat API (core模型)

响应:全面的markdown报告,带有来自权威源的引用,涵盖近期论文、关键创新和性能基准。

示例2:学术论文搜索 (路由到Perplexity)

查询:“查找临床试验中CRISPR脱靶效应的论文”

后端:Perplexity sonar-pro-search (学术模式)

响应:精选的5-8篇高影响力论文列表,带有完整引用、DOIs、引用次数和场所层级指示器。

示例3:比较分析 (路由到Parallel)

查询:“比较和对比mRNA疫苗与传统疫苗用于癌症治疗”

后端:Parallel Chat API (core模型)

响应:详细比较报告,带有来自多个源的数据、结构化分析和引用证据。

示例4:市场数据 (路由到Parallel)

查询:“2025年全球医疗保健AI采用统计数据”

后端:Parallel Chat API (core模型)

响应:当前市场数据、采用率、增长预测和区域分析,带有源引用。


总结

此技能作为主要研究接口,具有智能双后端路由:

  • Parallel Chat API (默认,core模型):全面的、多源研究,适用于任何主题
  • Perplexity sonar-pro-search:仅用于学术特定论文搜索
  • 自动路由:检测学术查询并适当路由
  • 手动覆盖:需要时强制任何后端
  • 互补:与parallel-web技能一起工作,用于网络搜索和URL提取