⚡

浏览器自动化Skill browser-automation

浏览器自动化技能，基于Nova Act AI技术，实现网页导航、交互操作、数据提取和标签页管理。适用于自动化测试、数据采集、网页监控和AI智能体应用。关键词：浏览器自动化、AI智能体、网页交互、数据提取、自动化测试、Nova Act AI、数据采集、网页监控。

AI智能体 0 次安装 2 次浏览更新于 3/11/2026

name: browser-automation description: 基于Nova Act AI的Web浏览器自动化 — 导航、交互、提取数据和管理标签页。

浏览器自动化

可用工具

browser_navigate(url): 导航到URL并捕获截图
browser_act(instruction): 使用自然语言执行浏览器操作（点击、输入、滚动、选择）。不支持拖拽。
browser_extract(extraction_instruction): 提取结构化数据（自动滚动整个页面，单次调用收集所有数据）
browser_get_page_info(): 获取页面结构和所有打开的标签页（快速，无AI）
browser_manage_tabs(action, tab_index): 切换、关闭或创建浏览器标签页
browser_save_screenshot(filename): 将当前页面截图保存到工作空间

工具选择

browser_navigate + browser_act: UI交互（点击、输入、滚动、表单填写）
browser_extract: 从可见内容提取结构化数据（自动滚动）
browser_get_page_info: 快速页面结构检查（<300毫秒）
browser_save_screenshot: 保存里程碑截图（搜索结果、确认信息、关键数据）

browser_act最佳实践

组合最多3个可预测步骤：如“1. 在搜索框中输入’笔记本电脑’ 2. 点击搜索按钮 3. 点击第一个结果”
失败时：查看截图以了解当前状态，然后从该点重试
对于视觉创作（图表、绘图），优先使用代码/文本输入方法，而非鼠标交互