搜索结果: "爬虫"
网络存档Skill web-archiving
这个技能涉及使用各种工具和方法来保存和检索网页内容,适用于新闻、研究和法律目的。包括Wayback Machine、Archive.today、ArchiveBox等服务的集成,以及Python代码实现,用于网页存档、历史访问和数据保存。关键词:网页存档、网络爬虫、数据保存、历史访问、法律证据、Python编程、API集成。
SEO优化Skill seo
这个技能专注于技术SEO、页面优化和结构化数据,基于Lighthouse SEO审计和Google搜索指南,帮助提高网站的搜索引擎可见性和排名。包括爬虫控制、XML站点地图、URL结构、HTTPS安全、标题标签优化、元描述、图像SEO、内部链接策略、结构化数据(如JSON-LD)实施、移动SEO和国际SEO优化,旨在提升网站在搜索引擎中的表现和用户访问体验。适用于网站开发、内容管理和数字营销领域。
AI搜索与内容提取工具Skill tavily-search
这是一个AI驱动的网络搜索和内容提取工具,能提供相关的、总结性的搜索结果,并从URL中提取干净可读的内容。适用于新闻研究、技术查询和时间敏感信息检索。关键词:AI搜索,内容提取,网络爬虫,信息检索,新闻研究。
文档爬虫Skill documentation-scraper
这个技能使用slurp-ai工具自动化爬取文档网站,将内容编译为markdown文件,优化用于AI代理的上下文注入。适用于需要本地文档副本或AI训练数据的场景,提高数据处理效率。关键词:文档爬虫、markdown转换、AI上下文、网站抓取、自动化脚本、slurp-ai、文档处理。
网页搜索Skill web-search
网页搜索技能允许用户通过 DuckDuckGo 搜索引擎快速检索网络上的实时信息、验证事实、查找文档和解答问题,返回标题、URL 和摘要片段,适用于信息获取、知识管理和数据验证场景。关键词:网页搜索,DuckDuckGo,信息检索,实时数据,SEO优化,网络爬虫,事实核查。
ChromeDevTools代理技能Skill chrome-devtools
这是一个用于浏览器自动化和网页调试的技能,通过Puppeteer实现自动化截图、性能分析、网络监控和Web爬虫功能,适用于Web开发测试和优化。关键词包括浏览器自动化、Puppeteer、Chrome DevTools、网页测试、性能监控、网络流量分析、JavaScript调试。
Cloudflare浏览器渲染自动化Skill cloudflare-browser-rendering
这个技能用于通过Cloudflare的浏览器渲染API实现无头浏览器自动化,包括截图捕获、PDF生成、网页内容提取和自动化测试。它支持多种集成方式,如REST API、Workers绑定(使用Puppeteer或Playwright)、MCP服务器和AI驱动的自动化,适用于网页爬虫、数据提取、应用测试和AI代理控制。关键词:浏览器自动化、截图、PDF生成、网页爬虫、Cloudflare Workers、无头浏览器、自动化测试、AI驱动。
营销AI搜索优化Skill marketing-ai-search-optimization
本技能专注于AI搜索与答案引擎优化(GEO),通过技术设置如爬虫控制和内容策略,提升网站在ChatGPT、Perplexity、Gemini、Google AI概述等平台的可见性。包括构建查询库、优化页面结构和测量模型份额,旨在让内容更易被AI助手引用和检索,从而驱动流量和增长。关键词:AI搜索优化、GEO、爬虫控制、引用策略、内容优化、SEO、可见性提升。
SEO技术与营销-完整技能Skill marketing-seo-complete
此技能提供全面的SEO技术和营销策略,涵盖技术审计、核心网页指标优化、爬虫可访问性、结构化数据、移动优化、营销策略、操作工作流和全面搜索优化。适用于2026年搜索引擎优化,包括关键词研究、内容规划、竞争分析、品牌建设和E-E-A-T策略。关键词:SEO, 技术审计, 核心网页指标, 爬虫可访问性, 结构化数据, 移动优化, 营销策略, 操作工作流, 全面搜索优化, 2026。
网页内容抓取器Skill web-fetch
网页内容抓取器是一个自动化工具,能够智能获取网页内容并转换为干净的markdown格式。它通过优先识别原生markdown响应,配合CSS选择器精准提取网页正文内容,支持多种知名网站的特殊处理,并提供回退机制确保提取成功率。适用于文档抓取、内容聚合、知识库构建等场景。关键词:网页抓取、HTML转markdown、内容提取、自动化工具、文档处理、爬虫技术、数据采集。
Playwright浏览器自动化Skill browsing-with-playwright
Playwright浏览器自动化技能是一个基于Playwright MCP的网页自动化工具,支持网站导航、表单填写、元素点击、截图和数据提取等功能。适用于网页抓取、UI测试、自动化测试、数据采集、网页爬虫和浏览器交互自动化等场景。关键词:浏览器自动化、Playwright、网页抓取、UI测试、数据采集、自动化测试、网页爬虫、表单提交、截图工具。
Gemini网络搜索Skill gemini-search
Gemini 网络搜索技能是一个高级信息检索工具,它通过调用 gemini 命令执行深度网络搜索,专门用于回答复杂问题、获取最新资讯和进行详细研究。其核心功能包括智能查询解析、多源信息整合与溯源。关键词:Gemini搜索,高级网络搜索,信息检索,复杂查询,网络爬虫,AI搜索工具,数据收集,信息整合。