搜索结果: "爬虫"
AI搜索与内容提取工具Skill tavily-search
这是一个AI驱动的网络搜索和内容提取工具,能提供相关的、总结性的搜索结果,并从URL中提取干净可读的内容。适用于新闻研究、技术查询和时间敏感信息检索。关键词:AI搜索,内容提取,网络爬虫,信息检索,新闻研究。
网页搜索Skill web-search
网页搜索技能允许用户通过 DuckDuckGo 搜索引擎快速检索网络上的实时信息、验证事实、查找文档和解答问题,返回标题、URL 和摘要片段,适用于信息获取、知识管理和数据验证场景。关键词:网页搜索,DuckDuckGo,信息检索,实时数据,SEO优化,网络爬虫,事实核查。
网络存档Skill web-archiving
这个技能涉及使用各种工具和方法来保存和检索网页内容,适用于新闻、研究和法律目的。包括Wayback Machine、Archive.today、ArchiveBox等服务的集成,以及Python代码实现,用于网页存档、历史访问和数据保存。关键词:网页存档、网络爬虫、数据保存、历史访问、法律证据、Python编程、API集成。
SEO优化Skill seo
这个技能专注于技术SEO、页面优化和结构化数据,基于Lighthouse SEO审计和Google搜索指南,帮助提高网站的搜索引擎可见性和排名。包括爬虫控制、XML站点地图、URL结构、HTTPS安全、标题标签优化、元描述、图像SEO、内部链接策略、结构化数据(如JSON-LD)实施、移动SEO和国际SEO优化,旨在提升网站在搜索引擎中的表现和用户访问体验。适用于网站开发、内容管理和数字营销领域。
网页内容抓取器Skill web-fetch
网页内容抓取器是一个自动化工具,能够智能获取网页内容并转换为干净的markdown格式。它通过优先识别原生markdown响应,配合CSS选择器精准提取网页正文内容,支持多种知名网站的特殊处理,并提供回退机制确保提取成功率。适用于文档抓取、内容聚合、知识库构建等场景。关键词:网页抓取、HTML转markdown、内容提取、自动化工具、文档处理、爬虫技术、数据采集。
营销AI搜索优化Skill marketing-ai-search-optimization
本技能专注于AI搜索与答案引擎优化(GEO),通过技术设置如爬虫控制和内容策略,提升网站在ChatGPT、Perplexity、Gemini、Google AI概述等平台的可见性。包括构建查询库、优化页面结构和测量模型份额,旨在让内容更易被AI助手引用和检索,从而驱动流量和增长。关键词:AI搜索优化、GEO、爬虫控制、引用策略、内容优化、SEO、可见性提升。
SEO技术与营销-完整技能Skill marketing-seo-complete
此技能提供全面的SEO技术和营销策略,涵盖技术审计、核心网页指标优化、爬虫可访问性、结构化数据、移动优化、营销策略、操作工作流和全面搜索优化。适用于2026年搜索引擎优化,包括关键词研究、内容规划、竞争分析、品牌建设和E-E-A-T策略。关键词:SEO, 技术审计, 核心网页指标, 爬虫可访问性, 结构化数据, 移动优化, 营销策略, 操作工作流, 全面搜索优化, 2026。
SiteArchitectureSkill site-architecture
这项技能涵盖了使网站内容能够被搜索引擎和AI爬虫发现的技术基础,包括优化robots.txt、站点地图、元标签、核心网页指标等,以提高网站的可发现性和搜索引擎排名。
Playwright浏览器自动化Skill browsing-with-playwright
Playwright浏览器自动化技能是一个基于Playwright MCP的网页自动化工具,支持网站导航、表单填写、元素点击、截图和数据提取等功能。适用于网页抓取、UI测试、自动化测试、数据采集、网页爬虫和浏览器交互自动化等场景。关键词:浏览器自动化、Playwright、网页抓取、UI测试、数据采集、自动化测试、网页爬虫、表单提交、截图工具。
Gemini网络搜索Skill gemini-search
Gemini 网络搜索技能是一个高级信息检索工具,它通过调用 gemini 命令执行深度网络搜索,专门用于回答复杂问题、获取最新资讯和进行详细研究。其核心功能包括智能查询解析、多源信息整合与溯源。关键词:Gemini搜索,高级网络搜索,信息检索,复杂查询,网络爬虫,AI搜索工具,数据收集,信息整合。
智能网页爬取器Skill web-scrape
智能网页爬取器是一款功能强大的网络数据提取工具,支持智能内容识别、多格式输出和自动化处理。该工具能够自动识别文章、产品、文档等不同类型网页,过滤导航菜单、广告等噪音内容,提取核心信息并以Markdown、JSON或纯文本格式输出。支持滚动加载、截图保存、错误处理等高级功能,适用于数据采集、内容分析、竞品研究等场景。关键词:网页爬取、数据提取、内容抓取、自动化采集、智能解析、网络爬虫、数据采集工具、信息提取、网页内容提取、自动化工具。
Twitter数据抓取工具Skill twscrape
twscrape是一个专业的Python库,专门用于Twitter/X社交媒体数据抓取和爬虫开发。通过GraphQL API实现高效数据采集,支持多账号轮换管理、异步并行操作、代理配置和会话持久化。适用于社交媒体监控、舆情分析、用户行为研究、趋势挖掘和大规模数据收集场景。关键词:Twitter爬虫、社交媒体数据采集、Python数据抓取、账号轮换、GraphQL API、异步爬虫、数据挖掘、舆情监控。