搜索结果: "爬虫"

4.5

Parsehub自动化Skill parsehub-automation

这个技能用于通过Rube MCP和Composio工具包自动化Parsehub网络爬虫任务。它支持工具发现、连接管理和执行自动化工作流,适用于DevOps、数据提取和工具集成场景。关键词:Parsehub自动化、Rube MCP、Composio、网络爬虫、数据爬取、自动化工作流、DevOps、工具集成、MCP协议、数据采集。

4.5

抓取文章Skill scrape-posts

此技能用于从Milan Jovanovic的.NET博客优化抓取新文章,通过预筛选列表页面,仅抓取新增或更新的内容,以减少API请求并提升效率。关键词:博客抓取、数据自动化、内容管理、SEO优化、网络爬虫、节省成本。

4.5

浏览器自动化Skill browser-automation

浏览器自动化技能专注于使用Chrome DevTools Protocol、WebDriver、Playwright等工具进行安全网页自动化、测试和爬虫,强调域名限制、凭证保护、审计日志和性能优化。适用于自动化测试、数据采集、安全验证和Web应用验证等场景,关键词包括浏览器自动化、安全测试、网页爬虫、自动化框架、性能优化、安全控制、测试驱动开发、网络拦截、并行执行。

4.5

浏览器自动化文档发现技能Skill browser-discovery

这是一个用于自动化浏览器操作以发现和抓取网页文档的技能。当网站使用JavaScript动态渲染内容导致传统curl工具失效时,该技能能自动检测可用的浏览器工具(如Antigravity、Cursor、Playwright),执行页面导航、等待JS渲染,并提取结构化数据。适用于JS渲染网站文档抓取、动态内容采集和自动化测试场景。关键词:浏览器自动化、JS渲染、文档发现、网页抓取、Playwright、Antigravity、Cursor、动态内容采集、自动化测试、爬虫工具。

4.5

浏览器自动化助手Skill agent-browser

浏览器自动化助手是一款功能强大的网页自动化测试与数据提取工具。它支持自动化导航、表单填写、元素交互、截图录屏、网络监控等操作,广泛应用于Web应用测试、数据抓取、UI自动化、回归测试等场景。核心功能包括:浏览器控制、元素定位、交互模拟、状态管理、性能调试。关键词:浏览器自动化、网页测试、数据提取、UI测试、自动化脚本、Web爬虫、回归测试、端到端测试。

4.5

Firecrawl抓取技能Skill firecrawl-scrape

Firecrawl抓取技能是一个通过Firecrawl MCP工具抓取网页并提取内容的技能,支持从URL或搜索查询获取结构化数据,适用于数据采集和网络内容分析,关键词包括:网页抓取、数据提取、Firecrawl、MCP、爬虫、内容抓取、SEO搜索。

4.5

新加坡房产数据抓取工具Skill sg-property-scraper

这是一个用于抓取新加坡房产租赁和销售房源信息的Python脚本工具。支持按房源类型、房产类型、价格、面积、地铁站、通勤时间等多种条件进行灵活筛选,并输出结构化JSON数据。适用于房产数据分析、市场调研、投资决策和自动化房产搜索等场景。关键词:新加坡房产、房产爬虫、房源搜索、租赁数据、销售数据、地铁站筛选、通勤时间、Python脚本、数据抓取、房产分析。

4.5

Python异步编程模式精通Skill async-python-patterns

此技能专注于Python的异步编程技术,包括asyncio、并发模式和async/await,用于开发高性能、非阻塞的后端应用、Web API和I/O密集型系统。关键词:Python异步编程、asyncio、并发、高性能应用、非阻塞操作、异步API、并发系统、I/O绑定、Web爬虫、实时应用。

4.5

SEO处理技能Skill seo-handler

SEO处理技能是一个针对Next.js框架的搜索引擎优化管理工具。它专注于站点地图管理、元数据配置、结构化数据生成、服务器端渲染优化和爬虫控制,旨在提升网站在Google、百度等搜索引擎中的排名和可见性。核心功能包括自动生成站点地图、优化OpenGraph标签、注入JSON-LD结构化数据、配置ISR缓存策略以及管理robots.txt文件。适用于前端开发者、SEO工程师和网站管理员,帮助实现技术SEO的最佳实践。

4.5

Cloudflare浏览器渲染技能Skill cloudflare-browser-rendering

这个技能是关于使用Cloudflare Browser Rendering服务进行浏览器自动化。它支持通过Puppeteer或Playwright工具在Cloudflare Workers上实现屏幕截图、PDF生成、网页抓取、自动化测试等任务。适用于开发者和企业,用于构建高效、可扩展的云原生应用。关键词:浏览器渲染, Cloudflare, Puppeteer, Playwright, 屏幕截图, PDF生成, 网页抓取, 浏览器自动化, Serverless, 无头浏览器, 网络爬虫

4.5

SEO优化Skill seo

这个技能专注于技术SEO、页面优化和结构化数据,基于Lighthouse SEO审计和Google搜索指南,帮助提高网站的搜索引擎可见性和排名。包括爬虫控制、XML站点地图、URL结构、HTTPS安全、标题标签优化、元描述、图像SEO、内部链接策略、结构化数据(如JSON-LD)实施、移动SEO和国际SEO优化,旨在提升网站在搜索引擎中的表现和用户访问体验。适用于网站开发、内容管理和数字营销领域。

4.5

Cloudflare浏览器渲染自动化Skill cloudflare-browser-rendering

这个技能用于通过Cloudflare的浏览器渲染API实现无头浏览器自动化,包括截图捕获、PDF生成、网页内容提取和自动化测试。它支持多种集成方式,如REST API、Workers绑定(使用Puppeteer或Playwright)、MCP服务器和AI驱动的自动化,适用于网页爬虫、数据提取、应用测试和AI代理控制。关键词:浏览器自动化、截图、PDF生成、网页爬虫、Cloudflare Workers、无头浏览器、自动化测试、AI驱动。