URL抓取器Skill url-fetcher

该技能用于从指定网页URL自动抓取并提取干净的文本内容，去除HTML噪音，适用于数据收集、内容分析、文档处理和网络爬虫等场景，支持参数化设置以提高效率。关键词：网页抓取、文本提取、URL解析、HTML清理、数据获取、网络爬虫、内容分析、自动化工具。

数据工程 3 次安装 41 次浏览更新于 3/11/2026

名称: URL抓取器描述: 从网页URL获取并提取文本内容。

URL抓取器

fetch_url_content(url, include_html=False, max_length=50000): 获取URL并提取干净文本内容。

从抓取的页面呈现信息时，将每个具体声明包裹在<cite>标签中：

<cite source="SOURCE_TITLE" url="URL">声明文本</cite>

规则: