搜索结果: "爬虫"
营销AI搜索优化Skill marketing-ai-search-optimization
本技能专注于AI搜索与答案引擎优化(GEO),通过技术设置如爬虫控制和内容策略,提升网站在ChatGPT、Perplexity、Gemini、Google AI概述等平台的可见性。包括构建查询库、优化页面结构和测量模型份额,旨在让内容更易被AI助手引用和检索,从而驱动流量和增长。关键词:AI搜索优化、GEO、爬虫控制、引用策略、内容优化、SEO、可见性提升。
Playwright浏览器自动化Skill browsing-with-playwright
Playwright浏览器自动化技能是一个基于Playwright MCP的网页自动化工具,支持网站导航、表单填写、元素点击、截图和数据提取等功能。适用于网页抓取、UI测试、自动化测试、数据采集、网页爬虫和浏览器交互自动化等场景。关键词:浏览器自动化、Playwright、网页抓取、UI测试、数据采集、自动化测试、网页爬虫、表单提交、截图工具。
Twitter数据抓取工具Skill twscrape
twscrape是一个专业的Python库,专门用于Twitter/X社交媒体数据抓取和爬虫开发。通过GraphQL API实现高效数据采集,支持多账号轮换管理、异步并行操作、代理配置和会话持久化。适用于社交媒体监控、舆情分析、用户行为研究、趋势挖掘和大规模数据收集场景。关键词:Twitter爬虫、社交媒体数据采集、Python数据抓取、账号轮换、GraphQL API、异步爬虫、数据挖掘、舆情监控。
网络存档Skill web-archiving
这个技能涉及使用各种工具和方法来保存和检索网页内容,适用于新闻、研究和法律目的。包括Wayback Machine、Archive.today、ArchiveBox等服务的集成,以及Python代码实现,用于网页存档、历史访问和数据保存。关键词:网页存档、网络爬虫、数据保存、历史访问、法律证据、Python编程、API集成。
SiteArchitectureSkill site-architecture
这项技能涵盖了使网站内容能够被搜索引擎和AI爬虫发现的技术基础,包括优化robots.txt、站点地图、元标签、核心网页指标等,以提高网站的可发现性和搜索引擎排名。
浏览器自动化助手Skill agent-browser
浏览器自动化助手是一款功能强大的网页自动化测试与数据提取工具。它支持自动化导航、表单填写、元素交互、截图录屏、网络监控等操作,广泛应用于Web应用测试、数据抓取、UI自动化、回归测试等场景。核心功能包括:浏览器控制、元素定位、交互模拟、状态管理、性能调试。关键词:浏览器自动化、网页测试、数据提取、UI测试、自动化脚本、Web爬虫、回归测试、端到端测试。
ZyteAPI自动化Skill zyte-api-automation
此技能通过 Rube MCP 和 Composio 工具包,自动化 Zyte API 任务,实现高效的网页数据提取和工作流管理。关键词:Zyte API, Rube MCP, Composio, API 自动化, 数据工程, 网页爬虫。
浏览器自动化文档发现技能Skill browser-discovery
这是一个用于自动化浏览器操作以发现和抓取网页文档的技能。当网站使用JavaScript动态渲染内容导致传统curl工具失效时,该技能能自动检测可用的浏览器工具(如Antigravity、Cursor、Playwright),执行页面导航、等待JS渲染,并提取结构化数据。适用于JS渲染网站文档抓取、动态内容采集和自动化测试场景。关键词:浏览器自动化、JS渲染、文档发现、网页抓取、Playwright、Antigravity、Cursor、动态内容采集、自动化测试、爬虫工具。
ActionbookScraperSkill actionbook-scraper
Actionbook Scraper技能是一个自动化网页数据抓取工具,能够使用Actionbook验证的选择器生成和验证网络爬虫脚本,自动修正错误,确保数据抓取的准确性和效率。
SEO处理技能Skill seo-handler
SEO处理技能是一个针对Next.js框架的搜索引擎优化管理工具。它专注于站点地图管理、元数据配置、结构化数据生成、服务器端渲染优化和爬虫控制,旨在提升网站在Google、百度等搜索引擎中的排名和可见性。核心功能包括自动生成站点地图、优化OpenGraph标签、注入JSON-LD结构化数据、配置ISR缓存策略以及管理robots.txt文件。适用于前端开发者、SEO工程师和网站管理员,帮助实现技术SEO的最佳实践。
网页数据抓取器Skill web-scraper
网页数据抓取器是一款基于CSS选择器的自动化工具,专门用于从网站高效提取结构化数据。支持分页抓取、速率控制防止被封,可输出JSON等多种格式。适用于数据采集、市场分析、竞品监控等场景。关键词:网页爬虫、数据抓取、HTML解析、自动化采集、CSS选择器、分页抓取、数据提取工具。
PuppeteerSkill puppeteer
Puppeteer是一款由Google开发的Node.js库,用于自动化控制无头Chrome或Chromium浏览器。它主要用于网页爬虫、自动化测试、PDF生成和网页截图。通过模拟用户操作,Puppeteer可以高效地处理动态网页内容,是前端开发、测试和DevOps领域的强大工具。