Firecrawl网页抓取工具Skill firecrawl-web

Firecrawl Web 技能是一个专业的网页数据抓取与处理工具,提供网页内容获取、屏幕截图、结构化数据提取、网络搜索和文档站点爬取功能。支持 Markdown 格式输出、JSON 模式数据提取、批量文档爬取,适用于数据采集、内容分析、信息监控和文档学习等场景。关键词:网页抓取、数据提取、网络爬虫、内容采集、API 集成、结构化数据、文档爬取、信息检索。

后端开发 5 次安装 84 次浏览 更新于 3/2/2026

name: firecrawl-web description: “获取网页内容、截取屏幕截图、提取结构化数据、搜索网络以及爬取文档站点。当用户需要最新的网络信息、要求抓取URL、想要截图、需要从页面提取特定数据或想要了解某个框架或库时使用。” allowed-tools: [“Bash”, “Read”, “Write”]

Firecrawl Web 技能

此技能通过 Firecrawl 的 API 提供网络访问功能。

脚本位置

所有命令都使用捆绑的脚本: ~/.claude/skills/firecrawl-web/fc.py

获取页面内容

以干净的 Markdown 格式获取任何网页:

python3 ~/.claude/skills/firecrawl-web/fc.py markdown "https://example.com"

获取更简洁的输出(不含导航和页脚):

python3 ~/.claude/skills/firecrawl-web/fc.py markdown "https://example.com" --main-only

截取屏幕截图

捕获整页截图:

python3 ~/.claude/skills/firecrawl-web/fc.py screenshot "https://example.com" -o page.png

提取结构化数据

使用 JSON 模式提取特定数据。首先创建一个模式文件:

{
  "type": "object",
  "properties": {
    "title": {"type": "string"},
    "price": {"type": "number"},
    "features": {"type": "array", "items": {"type": "string"}}
  }
}

然后提取:

python3 ~/.claude/skills/firecrawl-web/fc.py extract "https://example.com/product" --schema schema.json

添加提示以获得更好的准确性:

python3 ~/.claude/skills/firecrawl-web/fc.py extract "https://example.com/product" --schema schema.json --prompt "提取主要产品详情"

搜索网络

搜索最新信息:

python3 ~/.claude/skills/firecrawl-web/fc.py search "Python 3.13 新特性"

限制结果数量:

python3 ~/.claude/skills/firecrawl-web/fc.py search "最新 React 文档" --limit 3

爬取文档

爬取文档站点以了解新框架:

python3 ~/.claude/skills/firecrawl-web/fc.py crawl "https://docs.newframework.dev" --limit 30

将页面保存到目录:

python3 ~/.claude/skills/firecrawl-web/fc.py crawl "https://docs.example.com" --limit 50 --output ./docs

每个页面消耗一个积分。设置合理的限制以避免耗尽您的配额。