name: parallel-web description: “使用Parallel Chat API和Extract API搜索网络、提取URL内容并进行深度研究。用于所有网络搜索、研究查询和一般信息收集。提供带引用的综合摘要。” allowed-tools: [Read, Write, Edit, Bash]

Parallel Web Systems API

概述

这个技能提供了对Parallel Web Systems API的访问，用于网络搜索、深度研究和内容提取。它是科学写作工作流中所有web相关操作的主要工具。

主要接口: Parallel Chat API（与OpenAI兼容）用于搜索和研究。 次要接口: Extract API仅用于URL验证和特殊情况。

API文档: https://docs.parallel.ai API密钥: https://platform.parallel.ai 环境变量: PARALLEL_API_KEY

何时使用此技能

使用此技能处理所有以下情况：

网络搜索: 任何需要搜索互联网获取信息的查询
深度研究: 任何主题的综合研究报告
市场研究: 行业分析、竞争情报、市场数据
当前事件: 新闻、最近发展、公告
技术信息: 文档、规格、产品详情
统计数据: 市场规模、增长率、行业数字
一般信息: 公司简介、事实、比较

仅使用Extract API于：

引用验证（确认特定URL的内容）
特殊情况，当您需要从已知URL获取原始内容时

不要使用此技能于：

学术特定论文搜索（使用research-lookup，它路由到Perplexity处理纯学术查询）
Google Scholar / PubMed数据库搜索（使用citation-management技能）

两种能力

1. 网络搜索（`search`命令）

通过Parallel Chat API（base模型）搜索网络，并获取综合摘要和引用来源。

最适合： 一般网络搜索、当前事件、事实查找、技术查找、新闻、市场数据。

# 基本搜索
python scripts/parallel_web.py search "latest advances in quantum computing 2025"

# 使用core模型处理更复杂的查询
python scripts/parallel_web.py search "compare EV battery chemistries NMC vs LFP" --model core

# 保存结果到文件
python scripts/parallel_web.py search "renewable energy policy updates" -o results.txt

# JSON输出用于编程使用
python scripts/parallel_web.py search "AI regulation landscape" --json -o results.json

关键参数：

objective: 自然语言描述您想找到的内容
--model: 使用的聊天模型（默认base，或core用于更深入的研究）
-o: 输出文件路径
--json: 输出为JSON

响应包括： 按主题组织的综合摘要，带内联引用和来源列表。

2. 深度研究（`research`命令）

通过Parallel Chat API（core模型）运行全面的多源研究，生成带引用的详细情报报告。

最适合： 市场研究、全面分析、竞争情报、技术调查、行业报告、任何需要综合多个来源的研究问题。

# 默认深度研究（core模型）
python scripts/parallel_web.py research "comprehensive analysis of the global EV battery market"

# 保存研究报告到文件
python scripts/parallel_web.py research "AI adoption in healthcare 2025" -o report.md

# 使用base模型进行更快、更轻的研究
python scripts/parallel_web.py research "latest funding rounds in AI startups" --model base

# JSON输出
python scripts/parallel_web.py research "renewable energy storage market in Europe" --json -o data.json

关键参数：

query: 研究问题或主题
--model: 使用的聊天模型（深度研究默认core，或base用于更快结果）
-o: 输出文件路径
--json: 输出为JSON

3. URL提取（`extract`命令） — 仅验证

从特定URL提取内容。仅用于引用验证和特殊情况。

对于一般研究，使用search或research代替。

# 验证引用的内容
python scripts/parallel_web.py extract "https://example.com/article" --objective "key findings"

# 获取完整页面内容进行验证
python scripts/parallel_web.py extract "https://docs.example.com/api" --full-content

# 保存提取内容到文件
python scripts/parallel_web.py extract "https://paper-url.com" --objective "methodology" -o extracted.md

模型选择指南

Chat API支持两种研究模型。使用base进行大多数搜索，core进行深度研究。

模型	延迟	优势	使用时机
`base`	15s-100s	标准研究、事实查询	网络搜索、快速查找
`core`	60s-5min	复杂研究、多源综合	深度研究、综合报告

推荐：

search命令默认使用base — 快速，适合大多数查询
research命令默认使用core — 彻底，适合综合报告
当需要不同的深度/速度权衡时，使用--model覆盖

Python API使用

搜索

from parallel_web import ParallelSearch

searcher = ParallelSearch()
result = searcher.search(
    objective="Find latest information about transformer architectures in NLP",
    model="base",
)

if result["success"]:
    print(result["response"])  # 综合摘要
    for src in result["sources"]:
        print(f"  {src['title']}: {src['url']}")

深度研究

from parallel_web import ParallelDeepResearch

researcher = ParallelDeepResearch()
result = researcher.research(
    query="Comprehensive analysis of AI regulation in the EU and US",
    model="core",
)

if result["success"]:
    print(result["response"])  # 完整研究报告
    print(f"Citations: {result['citation_count']}")

提取（仅验证）

from parallel_web import ParallelExtract

extractor = ParallelExtract()
result = extractor.extract(
    urls=["https://docs.example.com/api-reference"],
    objective="API authentication methods and rate limits",
)

if result["success"]:
    for r in result["results"]:
        print(r["excerpts"])

强制：保存所有结果到Sources文件夹

每个网络搜索和深度研究结果必须保存到项目的sources/文件夹。

这确保所有研究都被保存，以实现可重复性、可审计性和上下文窗口恢复。

保存规则

操作	`-o`标志目标	文件名模式
网络搜索	`sources/search_<topic>.md`	`search_YYYYMMDD_HHMMSS_<brief_topic>.md`
深度研究	`sources/research_<topic>.md`	`research_YYYYMMDD_HHMMSS_<brief_topic>.md`
URL提取	`sources/extract_<source>.md`	`extract_YYYYMMDD_HHMMSS_<brief_source>.md`

如何保存（始终使用`-o`标志）

关键：每次调用parallel_web.py必须包括指向sources/文件夹的-o标志。

# 网络搜索 — 总是保存到sources/
python scripts/parallel_web.py search "latest advances in quantum computing 2025" \
  -o sources/search_20250217_143000_quantum_computing.md

# 深度研究 — 总是保存到sources/
python scripts/parallel_web.py research "comprehensive analysis of the global EV battery market" \
  -o sources/research_20250217_144000_ev_battery_market.md

# URL提取（仅验证） — 保存到sources/
python scripts/parallel_web.py extract "https://example.com/article" --objective "key findings" \
  -o sources/extract_20250217_143500_example_article.md

为什么保存所有内容

可重复性： 最终文档中的每个声明都可以追溯到其原始源材料
上下文窗口恢复： 如果上下文在任务中被压缩，可以从sources/重新读取保存的结果
审计跟踪： sources/文件夹提供了如何收集信息的完全透明度
跨部分重用： 保存的研究可以被多个部分引用，无需重复API调用
成本效率： 通过检查sources/中现有结果避免冗余API调用
同行评审支持： 评审者可以验证支持每个声明的研究

日志记录

保存研究结果时，总是记录：

[HH:MM:SS] SAVED: Search results to sources/search_20250217_143000_quantum_computing.md
[HH:MM:SS] SAVED: Deep research report to sources/research_20250217_144000_ev_battery_market.md

在提出新查询之前，先检查Sources

在调用parallel_web.py之前，检查sources/中是否已存在相关结果：

ls sources/  # 检查现有保存结果

与科学作家集成

路由表

任务	工具	命令
网络搜索（任何）	`parallel_web.py search`	`python scripts/parallel_web.py search "query" -o sources/search_<topic>.md`
深度研究	`parallel_web.py research`	`python scripts/parallel_web.py research "query" -o sources/research_<topic>.md`
引用验证	`parallel_web.py extract`	`python scripts/parallel_web.py extract "url" -o sources/extract_<source>.md`
学术论文搜索	`research_lookup.py`	路由到Perplexity sonar-pro-search
DOI/metadata查找	`parallel_web.py extract`	从DOI URL提取（验证）

在编写科学文档时

在编写任何部分之前， 使用search或research收集背景信息 — 保存结果到sources/
对于学术引用， 使用research-lookup（它将学术查询路由到Perplexity） — 保存结果到sources/
对于引用验证（确认特定URL），使用parallel_web.py extract — 保存结果到sources/
对于当前市场/行业数据， 使用parallel_web.py research --model core — 保存结果到sources/
在任何新查询之前， 检查sources/中现有结果以避免重复API调用

环境设置

# 必需：设置您的Parallel API密钥
export PARALLEL_API_KEY="your_api_key_here"

# 必需Python包
pip install openai        # 用于Chat API（搜索/研究）
pip install parallel-web  # 用于Extract API（仅验证）

获取您的API密钥在 https://platform.parallel.ai

错误处理

脚本优雅地处理错误并返回结构化错误响应：

{
  "success": false,
  "error": "错误描述",
  "timestamp": "2025-02-14 12:00:00"
}

常见问题：

PARALLEL_API_KEY not set: 设置环境变量
openai not installed: 运行pip install openai
parallel-web not installed: 运行pip install parallel-web（仅需用于提取）
Rate limit exceeded: 等待并重试（默认：Chat API 300 req/min）

补充技能

技能	用于
`research-lookup`	学术论文搜索（路由到Perplexity处理学术查询）
`citation-management`	Google Scholar, PubMed, CrossRef数据库搜索
`literature-review`	跨学术数据库的系统文献综述
`scientific-schematics`	从研究结果生成图表