浏览器自动化Skill browser-automation

浏览器自动化技能,基于Nova Act AI技术,实现网页导航、交互操作、数据提取和标签页管理。适用于自动化测试、数据采集、网页监控和AI智能体应用。关键词:浏览器自动化、AI智能体、网页交互、数据提取、自动化测试、Nova Act AI、数据采集、网页监控。

AI智能体 0 次安装 0 次浏览 更新于 3/11/2026

name: browser-automation description: 基于Nova Act AI的Web浏览器自动化 — 导航、交互、提取数据和管理标签页。

浏览器自动化

可用工具

  • browser_navigate(url): 导航到URL并捕获截图
  • browser_act(instruction): 使用自然语言执行浏览器操作(点击、输入、滚动、选择)。不支持拖拽。
  • browser_extract(extraction_instruction): 提取结构化数据(自动滚动整个页面,单次调用收集所有数据)
  • browser_get_page_info(): 获取页面结构和所有打开的标签页(快速,无AI)
  • browser_manage_tabs(action, tab_index): 切换、关闭或创建浏览器标签页
  • browser_save_screenshot(filename): 将当前页面截图保存到工作空间

工具选择

  • browser_navigate + browser_act: UI交互(点击、输入、滚动、表单填写)
  • browser_extract: 从可见内容提取结构化数据(自动滚动)
  • browser_get_page_info: 快速页面结构检查(<300毫秒)
  • browser_save_screenshot: 保存里程碑截图(搜索结果、确认信息、关键数据)

browser_act最佳实践

  • 组合最多3个可预测步骤:如“1. 在搜索框中输入’笔记本电脑’ 2. 点击搜索按钮 3. 点击第一个结果”
  • 失败时:查看截图以了解当前状态,然后从该点重试
  • 对于视觉创作(图表、绘图),优先使用代码/文本输入方法,而非鼠标交互