搜索结果: "爬虫"

4.5

浏览器自动化Skill browser-automation

浏览器自动化技能专注于使用Chrome DevTools Protocol、WebDriver、Playwright等工具进行安全网页自动化、测试和爬虫,强调域名限制、凭证保护、审计日志和性能优化。适用于自动化测试、数据采集、安全验证和Web应用验证等场景,关键词包括浏览器自动化、安全测试、网页爬虫、自动化框架、性能优化、安全控制、测试驱动开发、网络拦截、并行执行。

4.5

Parsehub自动化Skill parsehub-automation

这个技能用于通过Rube MCP和Composio工具包自动化Parsehub网络爬虫任务。它支持工具发现、连接管理和执行自动化工作流,适用于DevOps、数据提取和工具集成场景。关键词:Parsehub自动化、Rube MCP、Composio、网络爬虫、数据爬取、自动化工作流、DevOps、工具集成、MCP协议、数据采集。

4.5

抓取文章Skill scrape-posts

此技能用于从Milan Jovanovic的.NET博客优化抓取新文章,通过预筛选列表页面,仅抓取新增或更新的内容,以减少API请求并提升效率。关键词:博客抓取、数据自动化、内容管理、SEO优化、网络爬虫、节省成本。

4.5

浏览器自动化文档发现技能Skill browser-discovery

这是一个用于自动化浏览器操作以发现和抓取网页文档的技能。当网站使用JavaScript动态渲染内容导致传统curl工具失效时,该技能能自动检测可用的浏览器工具(如Antigravity、Cursor、Playwright),执行页面导航、等待JS渲染,并提取结构化数据。适用于JS渲染网站文档抓取、动态内容采集和自动化测试场景。关键词:浏览器自动化、JS渲染、文档发现、网页抓取、Playwright、Antigravity、Cursor、动态内容采集、自动化测试、爬虫工具。

4.5

浏览器自动化助手Skill agent-browser

浏览器自动化助手是一款功能强大的网页自动化测试与数据提取工具。它支持自动化导航、表单填写、元素交互、截图录屏、网络监控等操作,广泛应用于Web应用测试、数据抓取、UI自动化、回归测试等场景。核心功能包括:浏览器控制、元素定位、交互模拟、状态管理、性能调试。关键词:浏览器自动化、网页测试、数据提取、UI测试、自动化脚本、Web爬虫、回归测试、端到端测试。

4.5

Firecrawl抓取技能Skill firecrawl-scrape

Firecrawl抓取技能是一个通过Firecrawl MCP工具抓取网页并提取内容的技能,支持从URL或搜索查询获取结构化数据,适用于数据采集和网络内容分析,关键词包括:网页抓取、数据提取、Firecrawl、MCP、爬虫、内容抓取、SEO搜索。

4.5

新加坡房产数据抓取工具Skill sg-property-scraper

这是一个用于抓取新加坡房产租赁和销售房源信息的Python脚本工具。支持按房源类型、房产类型、价格、面积、地铁站、通勤时间等多种条件进行灵活筛选,并输出结构化JSON数据。适用于房产数据分析、市场调研、投资决策和自动化房产搜索等场景。关键词:新加坡房产、房产爬虫、房源搜索、租赁数据、销售数据、地铁站筛选、通勤时间、Python脚本、数据抓取、房产分析。

4.5

Python异步编程模式精通Skill async-python-patterns

此技能专注于Python的异步编程技术,包括asyncio、并发模式和async/await,用于开发高性能、非阻塞的后端应用、Web API和I/O密集型系统。关键词:Python异步编程、asyncio、并发、高性能应用、非阻塞操作、异步API、并发系统、I/O绑定、Web爬虫、实时应用。

4.5

SEO处理技能Skill seo-handler

SEO处理技能是一个针对Next.js框架的搜索引擎优化管理工具。它专注于站点地图管理、元数据配置、结构化数据生成、服务器端渲染优化和爬虫控制,旨在提升网站在Google、百度等搜索引擎中的排名和可见性。核心功能包括自动生成站点地图、优化OpenGraph标签、注入JSON-LD结构化数据、配置ISR缓存策略以及管理robots.txt文件。适用于前端开发者、SEO工程师和网站管理员,帮助实现技术SEO的最佳实践。

4.5

Cloudflare浏览器渲染技能Skill cloudflare-browser-rendering

这个技能是关于使用Cloudflare Browser Rendering服务进行浏览器自动化。它支持通过Puppeteer或Playwright工具在Cloudflare Workers上实现屏幕截图、PDF生成、网页抓取、自动化测试等任务。适用于开发者和企业,用于构建高效、可扩展的云原生应用。关键词:浏览器渲染, Cloudflare, Puppeteer, Playwright, 屏幕截图, PDF生成, 网页抓取, 浏览器自动化, Serverless, 无头浏览器, 网络爬虫

4.5

ZyteAPI自动化Skill zyte-api-automation

此技能通过 Rube MCP 和 Composio 工具包,自动化 Zyte API 任务,实现高效的网页数据提取和工作流管理。关键词:Zyte API, Rube MCP, Composio, API 自动化, 数据工程, 网页爬虫。

4.5

文档爬虫Skill documentation-scraper

这个技能使用slurp-ai工具自动化爬取文档网站,将内容编译为markdown文件,优化用于AI代理的上下文注入。适用于需要本地文档副本或AI训练数据的场景,提高数据处理效率。关键词:文档爬虫、markdown转换、AI上下文、网站抓取、自动化脚本、slurp-ai、文档处理。