首页/人工智能/AI智能体/浏览器自动化Skill/
name: browser-automation
description: 基于Nova Act AI的Web浏览器自动化 — 导航、交互、提取数据和管理标签页。
浏览器自动化
可用工具
- browser_navigate(url): 导航到URL并捕获截图
- browser_act(instruction): 使用自然语言执行浏览器操作(点击、输入、滚动、选择)。不支持拖拽。
- browser_extract(extraction_instruction): 提取结构化数据(自动滚动整个页面,单次调用收集所有数据)
- browser_get_page_info(): 获取页面结构和所有打开的标签页(快速,无AI)
- browser_manage_tabs(action, tab_index): 切换、关闭或创建浏览器标签页
- browser_save_screenshot(filename): 将当前页面截图保存到工作空间
工具选择
browser_navigate + browser_act: UI交互(点击、输入、滚动、表单填写)
browser_extract: 从可见内容提取结构化数据(自动滚动)
browser_get_page_info: 快速页面结构检查(<300毫秒)
browser_save_screenshot: 保存里程碑截图(搜索结果、确认信息、关键数据)
browser_act最佳实践
- 组合最多3个可预测步骤:如“1. 在搜索框中输入’笔记本电脑’ 2. 点击搜索按钮 3. 点击第一个结果”
- 失败时:查看截图以了解当前状态,然后从该点重试
- 对于视觉创作(图表、绘图),优先使用代码/文本输入方法,而非鼠标交互