搜索结果: "爬虫"
SEO处理技能Skill seo-handler
SEO处理技能是一个针对Next.js框架的搜索引擎优化管理工具。它专注于站点地图管理、元数据配置、结构化数据生成、服务器端渲染优化和爬虫控制,旨在提升网站在Google、百度等搜索引擎中的排名和可见性。核心功能包括自动生成站点地图、优化OpenGraph标签、注入JSON-LD结构化数据、配置ISR缓存策略以及管理robots.txt文件。适用于前端开发者、SEO工程师和网站管理员,帮助实现技术SEO的最佳实践。
ZyteAPI自动化Skill zyte-api-automation
此技能通过 Rube MCP 和 Composio 工具包,自动化 Zyte API 任务,实现高效的网页数据提取和工作流管理。关键词:Zyte API, Rube MCP, Composio, API 自动化, 数据工程, 网页爬虫。
SEO技术与营销-完整技能Skill marketing-seo-complete
此技能提供全面的SEO技术和营销策略,涵盖技术审计、核心网页指标优化、爬虫可访问性、结构化数据、移动优化、营销策略、操作工作流和全面搜索优化。适用于2026年搜索引擎优化,包括关键词研究、内容规划、竞争分析、品牌建设和E-E-A-T策略。关键词:SEO, 技术审计, 核心网页指标, 爬虫可访问性, 结构化数据, 移动优化, 营销策略, 操作工作流, 全面搜索优化, 2026。
网络存档Skill web-archiving
这个技能涉及使用各种工具和方法来保存和检索网页内容,适用于新闻、研究和法律目的。包括Wayback Machine、Archive.today、ArchiveBox等服务的集成,以及Python代码实现,用于网页存档、历史访问和数据保存。关键词:网页存档、网络爬虫、数据保存、历史访问、法律证据、Python编程、API集成。
SEO优化Skill seo
这个技能专注于技术SEO、页面优化和结构化数据,基于Lighthouse SEO审计和Google搜索指南,帮助提高网站的搜索引擎可见性和排名。包括爬虫控制、XML站点地图、URL结构、HTTPS安全、标题标签优化、元描述、图像SEO、内部链接策略、结构化数据(如JSON-LD)实施、移动SEO和国际SEO优化,旨在提升网站在搜索引擎中的表现和用户访问体验。适用于网站开发、内容管理和数字营销领域。
网页搜索Skill web-search
网页搜索技能允许用户通过 DuckDuckGo 搜索引擎快速检索网络上的实时信息、验证事实、查找文档和解答问题,返回标题、URL 和摘要片段,适用于信息获取、知识管理和数据验证场景。关键词:网页搜索,DuckDuckGo,信息检索,实时数据,SEO优化,网络爬虫,事实核查。
Cloudflare浏览器渲染自动化Skill cloudflare-browser-rendering
这个技能用于通过Cloudflare的浏览器渲染API实现无头浏览器自动化,包括截图捕获、PDF生成、网页内容提取和自动化测试。它支持多种集成方式,如REST API、Workers绑定(使用Puppeteer或Playwright)、MCP服务器和AI驱动的自动化,适用于网页爬虫、数据提取、应用测试和AI代理控制。关键词:浏览器自动化、截图、PDF生成、网页爬虫、Cloudflare Workers、无头浏览器、自动化测试、AI驱动。
网络爬虫Skill web-scraper
网络爬虫技能用于抓取网页内容并转换为干净的 Markdown 格式,适用于自动化数据提取、文章阅读和信息收集。包含关键词如 Web 抓取、HTML 转换、Markdown、数据爬取、网页解析和自动化脚本。
文档爬虫Skill documentation-scraper
这个技能使用slurp-ai工具自动化爬取文档网站,将内容编译为markdown文件,优化用于AI代理的上下文注入。适用于需要本地文档副本或AI训练数据的场景,提高数据处理效率。关键词:文档爬虫、markdown转换、AI上下文、网站抓取、自动化脚本、slurp-ai、文档处理。
营销AI搜索优化Skill marketing-ai-search-optimization
本技能专注于AI搜索与答案引擎优化(GEO),通过技术设置如爬虫控制和内容策略,提升网站在ChatGPT、Perplexity、Gemini、Google AI概述等平台的可见性。包括构建查询库、优化页面结构和测量模型份额,旨在让内容更易被AI助手引用和检索,从而驱动流量和增长。关键词:AI搜索优化、GEO、爬虫控制、引用策略、内容优化、SEO、可见性提升。
网页内容抓取器Skill web-fetch
网页内容抓取器是一个自动化工具,能够智能获取网页内容并转换为干净的markdown格式。它通过优先识别原生markdown响应,配合CSS选择器精准提取网页正文内容,支持多种知名网站的特殊处理,并提供回退机制确保提取成功率。适用于文档抓取、内容聚合、知识库构建等场景。关键词:网页抓取、HTML转markdown、内容提取、自动化工具、文档处理、爬虫技术、数据采集。
SiteArchitectureSkill site-architecture
这项技能涵盖了使网站内容能够被搜索引擎和AI爬虫发现的技术基础,包括优化robots.txt、站点地图、元标签、核心网页指标等,以提高网站的可发现性和搜索引擎排名。