name: parallel-web description: “使用Parallel Chat API和Extract API搜索网络、提取URL内容并进行深度研究。用于所有网络搜索、研究查询和一般信息收集。提供带引用的综合摘要。” allowed-tools: [Read, Write, Edit, Bash]
Parallel Web Systems API
概述
这个技能提供了对Parallel Web Systems API的访问,用于网络搜索、深度研究和内容提取。它是科学写作工作流中所有web相关操作的主要工具。
主要接口: Parallel Chat API(与OpenAI兼容)用于搜索和研究。 次要接口: Extract API仅用于URL验证和特殊情况。
API文档: https://docs.parallel.ai
API密钥: https://platform.parallel.ai
环境变量: PARALLEL_API_KEY
何时使用此技能
使用此技能处理所有以下情况:
- 网络搜索: 任何需要搜索互联网获取信息的查询
- 深度研究: 任何主题的综合研究报告
- 市场研究: 行业分析、竞争情报、市场数据
- 当前事件: 新闻、最近发展、公告
- 技术信息: 文档、规格、产品详情
- 统计数据: 市场规模、增长率、行业数字
- 一般信息: 公司简介、事实、比较
仅使用Extract API于:
- 引用验证(确认特定URL的内容)
- 特殊情况,当您需要从已知URL获取原始内容时
不要使用此技能于:
- 学术特定论文搜索(使用
research-lookup,它路由到Perplexity处理纯学术查询) - Google Scholar / PubMed数据库搜索(使用
citation-management技能)
两种能力
1. 网络搜索(search命令)
通过Parallel Chat API(base模型)搜索网络,并获取综合摘要和引用来源。
最适合: 一般网络搜索、当前事件、事实查找、技术查找、新闻、市场数据。
# 基本搜索
python scripts/parallel_web.py search "latest advances in quantum computing 2025"
# 使用core模型处理更复杂的查询
python scripts/parallel_web.py search "compare EV battery chemistries NMC vs LFP" --model core
# 保存结果到文件
python scripts/parallel_web.py search "renewable energy policy updates" -o results.txt
# JSON输出用于编程使用
python scripts/parallel_web.py search "AI regulation landscape" --json -o results.json
关键参数:
objective: 自然语言描述您想找到的内容--model: 使用的聊天模型(默认base,或core用于更深入的研究)-o: 输出文件路径--json: 输出为JSON
响应包括: 按主题组织的综合摘要,带内联引用和来源列表。
2. 深度研究(research命令)
通过Parallel Chat API(core模型)运行全面的多源研究,生成带引用的详细情报报告。
最适合: 市场研究、全面分析、竞争情报、技术调查、行业报告、任何需要综合多个来源的研究问题。
# 默认深度研究(core模型)
python scripts/parallel_web.py research "comprehensive analysis of the global EV battery market"
# 保存研究报告到文件
python scripts/parallel_web.py research "AI adoption in healthcare 2025" -o report.md
# 使用base模型进行更快、更轻的研究
python scripts/parallel_web.py research "latest funding rounds in AI startups" --model base
# JSON输出
python scripts/parallel_web.py research "renewable energy storage market in Europe" --json -o data.json
关键参数:
query: 研究问题或主题--model: 使用的聊天模型(深度研究默认core,或base用于更快结果)-o: 输出文件路径--json: 输出为JSON
3. URL提取(extract命令) — 仅验证
从特定URL提取内容。仅用于引用验证和特殊情况。
对于一般研究,使用search或research代替。
# 验证引用的内容
python scripts/parallel_web.py extract "https://example.com/article" --objective "key findings"
# 获取完整页面内容进行验证
python scripts/parallel_web.py extract "https://docs.example.com/api" --full-content
# 保存提取内容到文件
python scripts/parallel_web.py extract "https://paper-url.com" --objective "methodology" -o extracted.md
模型选择指南
Chat API支持两种研究模型。使用base进行大多数搜索,core进行深度研究。
| 模型 | 延迟 | 优势 | 使用时机 |
|---|---|---|---|
base |
15s-100s | 标准研究、事实查询 | 网络搜索、快速查找 |
core |
60s-5min | 复杂研究、多源综合 | 深度研究、综合报告 |
推荐:
search命令默认使用base— 快速,适合大多数查询research命令默认使用core— 彻底,适合综合报告- 当需要不同的深度/速度权衡时,使用
--model覆盖
Python API使用
搜索
from parallel_web import ParallelSearch
searcher = ParallelSearch()
result = searcher.search(
objective="Find latest information about transformer architectures in NLP",
model="base",
)
if result["success"]:
print(result["response"]) # 综合摘要
for src in result["sources"]:
print(f" {src['title']}: {src['url']}")
深度研究
from parallel_web import ParallelDeepResearch
researcher = ParallelDeepResearch()
result = researcher.research(
query="Comprehensive analysis of AI regulation in the EU and US",
model="core",
)
if result["success"]:
print(result["response"]) # 完整研究报告
print(f"Citations: {result['citation_count']}")
提取(仅验证)
from parallel_web import ParallelExtract
extractor = ParallelExtract()
result = extractor.extract(
urls=["https://docs.example.com/api-reference"],
objective="API authentication methods and rate limits",
)
if result["success"]:
for r in result["results"]:
print(r["excerpts"])
强制:保存所有结果到Sources文件夹
每个网络搜索和深度研究结果必须保存到项目的sources/文件夹。
这确保所有研究都被保存,以实现可重复性、可审计性和上下文窗口恢复。
保存规则
| 操作 | -o标志目标 |
文件名模式 |
|---|---|---|
| 网络搜索 | sources/search_<topic>.md |
search_YYYYMMDD_HHMMSS_<brief_topic>.md |
| 深度研究 | sources/research_<topic>.md |
research_YYYYMMDD_HHMMSS_<brief_topic>.md |
| URL提取 | sources/extract_<source>.md |
extract_YYYYMMDD_HHMMSS_<brief_source>.md |
如何保存(始终使用-o标志)
关键:每次调用parallel_web.py必须包括指向sources/文件夹的-o标志。
# 网络搜索 — 总是保存到sources/
python scripts/parallel_web.py search "latest advances in quantum computing 2025" \
-o sources/search_20250217_143000_quantum_computing.md
# 深度研究 — 总是保存到sources/
python scripts/parallel_web.py research "comprehensive analysis of the global EV battery market" \
-o sources/research_20250217_144000_ev_battery_market.md
# URL提取(仅验证) — 保存到sources/
python scripts/parallel_web.py extract "https://example.com/article" --objective "key findings" \
-o sources/extract_20250217_143500_example_article.md
为什么保存所有内容
- 可重复性: 最终文档中的每个声明都可以追溯到其原始源材料
- 上下文窗口恢复: 如果上下文在任务中被压缩,可以从
sources/重新读取保存的结果 - 审计跟踪:
sources/文件夹提供了如何收集信息的完全透明度 - 跨部分重用: 保存的研究可以被多个部分引用,无需重复API调用
- 成本效率: 通过检查
sources/中现有结果避免冗余API调用 - 同行评审支持: 评审者可以验证支持每个声明的研究
日志记录
保存研究结果时,总是记录:
[HH:MM:SS] SAVED: Search results to sources/search_20250217_143000_quantum_computing.md
[HH:MM:SS] SAVED: Deep research report to sources/research_20250217_144000_ev_battery_market.md
在提出新查询之前,先检查Sources
在调用parallel_web.py之前,检查sources/中是否已存在相关结果:
ls sources/ # 检查现有保存结果
与科学作家集成
路由表
| 任务 | 工具 | 命令 |
|---|---|---|
| 网络搜索(任何) | parallel_web.py search |
python scripts/parallel_web.py search "query" -o sources/search_<topic>.md |
| 深度研究 | parallel_web.py research |
python scripts/parallel_web.py research "query" -o sources/research_<topic>.md |
| 引用验证 | parallel_web.py extract |
python scripts/parallel_web.py extract "url" -o sources/extract_<source>.md |
| 学术论文搜索 | research_lookup.py |
路由到Perplexity sonar-pro-search |
| DOI/metadata查找 | parallel_web.py extract |
从DOI URL提取(验证) |
在编写科学文档时
- 在编写任何部分之前, 使用
search或research收集背景信息 — 保存结果到sources/ - 对于学术引用, 使用
research-lookup(它将学术查询路由到Perplexity) — 保存结果到sources/ - 对于引用验证(确认特定URL),使用
parallel_web.py extract— 保存结果到sources/ - 对于当前市场/行业数据, 使用
parallel_web.py research --model core— 保存结果到sources/ - 在任何新查询之前, 检查
sources/中现有结果以避免重复API调用
环境设置
# 必需:设置您的Parallel API密钥
export PARALLEL_API_KEY="your_api_key_here"
# 必需Python包
pip install openai # 用于Chat API(搜索/研究)
pip install parallel-web # 用于Extract API(仅验证)
获取您的API密钥在 https://platform.parallel.ai
错误处理
脚本优雅地处理错误并返回结构化错误响应:
{
"success": false,
"error": "错误描述",
"timestamp": "2025-02-14 12:00:00"
}
常见问题:
PARALLEL_API_KEY not set: 设置环境变量openai not installed: 运行pip install openaiparallel-web not installed: 运行pip install parallel-web(仅需用于提取)Rate limit exceeded: 等待并重试(默认:Chat API 300 req/min)
补充技能
| 技能 | 用于 |
|---|---|
research-lookup |
学术论文搜索(路由到Perplexity处理学术查询) |
citation-management |
Google Scholar, PubMed, CrossRef数据库搜索 |
literature-review |
跨学术数据库的系统文献综述 |
scientific-schematics |
从研究结果生成图表 |