网页数据抓取器Skill web-scraper

网页数据抓取器是一款基于CSS选择器的自动化工具,专门用于从网站高效提取结构化数据。支持分页抓取、速率控制防止被封,可输出JSON等多种格式。适用于数据采集、市场分析、竞品监控等场景。关键词:网页爬虫、数据抓取、HTML解析、自动化采集、CSS选择器、分页抓取、数据提取工具。

后端开发 0 次安装 2 次浏览 更新于 2/28/2026

name: web-scraper description: 使用CSS选择器从网页提取数据,支持分页、限速和多种输出格式。 metadata: short-description: 从网站爬取数据 source: repository: https://github.com/cheeriojs/cheerio license: MIT

网页数据抓取工具

描述

使用CSS选择器从网页提取结构化数据,支持速率限制和分页功能。

触发条件

  • /scrape 命令
  • 用户请求提取网页数据
  • 用户需要解析HTML

使用方法

# 抓取单个页面
python scripts/web_scraper.py --url "https://example.com" --selector ".item" --output data.json

# 使用多个选择器抓取
python scripts/web_scraper.py --url "https://example.com" --selectors "title:.title,price:.price,link:a@href"

# 抓取多个页面
python scripts/web_scraper.py --urls urls.txt --selector ".product" --output products.json --delay 2

标签

数据抓取, 网页, html, 数据提取, 自动化

兼容性

  • Codex: ✅
  • Claude Code: ✅