浏览器自动化助手Skill agent-browser

浏览器自动化助手是一款功能强大的网页自动化测试与数据提取工具。它支持自动化导航、表单填写、元素交互、截图录屏、网络监控等操作,广泛应用于Web应用测试、数据抓取、UI自动化、回归测试等场景。核心功能包括:浏览器控制、元素定位、交互模拟、状态管理、性能调试。关键词:浏览器自动化、网页测试、数据提取、UI测试、自动化脚本、Web爬虫、回归测试、端到端测试。

测试 0 次安装 2 次浏览 更新于 2/28/2026

名称: 浏览器自动化助手 描述: “用于网页测试、截图、数据提取的浏览器自动化工具。使用场景:导航网站、填写表单、测试Web应用。触发词:‘打开浏览器’、‘截图’、‘点击元素’。” 允许工具: Bash(浏览器自动化助手:*)

浏览器自动化助手

快速开始

浏览器自动化助手 打开 <网址>        # 导航到页面
浏览器自动化助手 快照 -i           # 获取带引用标识的交互元素
浏览器自动化助手 点击 @e1          # 通过引用标识点击元素
浏览器自动化助手 填写 @e2 "文本"   # 通过引用标识填写输入框
浏览器自动化助手 关闭              # 关闭浏览器

核心工作流

  1. 导航: 浏览器自动化助手 打开 <网址>
  2. 快照: 浏览器自动化助手 快照 -i (返回带引用标识的元素,如 @e1@e2)
  3. 使用快照中的引用标识进行交互
  4. 导航或DOM发生重大变化后重新快照

命令

导航

浏览器自动化助手 打开 <网址>      # 导航到URL
浏览器自动化助手 后退            # 后退
浏览器自动化助手 前进            # 前进
浏览器自动化助手 重新加载        # 重新加载页面
浏览器自动化助手 关闭            # 关闭浏览器

快照 (页面分析)

浏览器自动化助手 快照            # 完整的无障碍树
浏览器自动化助手 快照 -i         # 仅交互元素 (推荐)
浏览器自动化助手 快照 -c         # 紧凑输出
浏览器自动化助手 快照 -d 3       # 限制深度为3
浏览器自动化助手 快照 -s "#main" # 限定到CSS选择器

交互 (使用快照中的@引用标识)

浏览器自动化助手 点击 @e1           # 点击
浏览器自动化助手 双击 @e1           # 双击
浏览器自动化助手 聚焦 @e1           # 聚焦元素
浏览器自动化助手 填写 @e2 "文本"     # 清空并输入
浏览器自动化助手 输入 @e2 "文本"     # 不清空直接输入
浏览器自动化助手 按键 Enter         # 按下按键
浏览器自动化助手 按键 Control+a     # 组合键
浏览器自动化助手 按键按下 Shift     # 按住按键
浏览器自动化助手 按键抬起 Shift     # 释放按键
浏览器自动化助手 悬停 @e1           # 悬停
浏览器自动化助手 勾选 @e1           # 勾选复选框
浏览器自动化助手 取消勾选 @e1       # 取消勾选复选框
浏览器自动化助手 选择 @e1 "值"      # 选择下拉框
浏览器自动化助手 滚动 向下 500      # 滚动页面
浏览器自动化助手 滚动到视图 @e1     # 将元素滚动到视图内
浏览器自动化助手 拖拽 @e1 @e2       # 拖放
浏览器自动化助手 上传 @e1 文件.pdf  # 上传文件

获取信息

浏览器自动化助手 获取 文本 @e1        # 获取元素文本
浏览器自动化助手 获取 html @e1        # 获取innerHTML
浏览器自动化助手 获取 值 @e1          # 获取输入值
浏览器自动化助手 获取 属性 @e1 href   # 获取属性
浏览器自动化助手 获取 标题            # 获取页面标题
浏览器自动化助手 获取 网址            # 获取当前URL
浏览器自动化助手 获取 数量 ".item"   # 统计匹配元素数量
浏览器自动化助手 获取 框 @e1          # 获取边界框

检查状态

浏览器自动化助手 是否可见 @e1      # 检查是否可见
浏览器自动化助手 是否启用 @e1      # 检查是否启用
浏览器自动化助手 是否勾选 @e1      # 检查是否勾选

截图与PDF

浏览器自动化助手 截图              # 截图输出到stdout
浏览器自动化助手 截图 路径.png     # 保存到文件
浏览器自动化助手 截图 --完整       # 完整页面
浏览器自动化助手 pdf 输出.pdf      # 保存为PDF

视频录制

浏览器自动化助手 录制 开始 ./演示.webm    # 开始录制 (使用当前URL和状态)
浏览器自动化助手 点击 @e1                 # 执行操作
浏览器自动化助手 录制 停止                 # 停止并保存视频
浏览器自动化助手 录制 重新开始 ./第二版.webm # 停止当前并开始新录制

录制会创建一个新的上下文,但保留会话中的cookie/存储。如果未提供URL,会自动返回到当前页面。为了流畅演示,请先探索,然后开始录制。

等待

浏览器自动化助手 等待 @e1                     # 等待元素出现
浏览器自动化助手 等待 2000                    # 等待毫秒数
浏览器自动化助手 等待 --文本 "成功"           # 等待文本出现
浏览器自动化助手 等待 --网址 "**/仪表盘"      # 等待URL模式匹配
浏览器自动化助手 等待 --加载 网络空闲         # 等待网络空闲
浏览器自动化助手 等待 --函数 "window.ready"   # 等待JS条件满足

鼠标控制

浏览器自动化助手 鼠标 移动 100 200      # 移动鼠标
浏览器自动化助手 鼠标 按下 左键         # 按下鼠标按钮
浏览器自动化助手 鼠标 抬起 左键         # 释放鼠标按钮
浏览器自动化助手 鼠标 滚轮 100          # 滚动滚轮

语义定位器 (引用标识的替代方案)

浏览器自动化助手 查找 角色 按钮 点击 --名称 "提交"
浏览器自动化助手 查找 文本 "登录" 点击
浏览器自动化助手 查找 标签 "邮箱" 填写 "用户@测试.com"
浏览器自动化助手 查找 第一个 ".item" 点击
浏览器自动化助手 查找 第n个 2 "a" 文本

浏览器设置

浏览器自动化助手 设置 视口 1920 1080      # 设置视口大小
浏览器自动化助手 设置 设备 "iPhone 14"   # 模拟设备
浏览器自动化助手 设置 地理位置 37.7749 -122.4194   # 设置地理位置
浏览器自动化助手 设置 离线 开启          # 切换离线模式
浏览器自动化助手 设置 请求头 '{"X-Key":"v"}' # 额外HTTP请求头
浏览器自动化助手 设置 凭证 用户 密码     # HTTP基本认证
浏览器自动化助手 设置 媒体 深色          # 模拟配色方案

Cookie与存储

浏览器自动化助手 cookies                     # 获取所有cookie
浏览器自动化助手 cookies 设置 名称 值        # 设置cookie
浏览器自动化助手 cookies 清除                 # 清除cookie
浏览器自动化助手 存储 本地                   # 获取所有localStorage
浏览器自动化助手 存储 本地 键                # 获取特定键
浏览器自动化助手 存储 本地 设置 键 值        # 设置值
浏览器自动化助手 存储 本地 清除              # 清除所有

网络

浏览器自动化助手 网络 路由 <网址>              # 拦截请求
浏览器自动化助手 网络 路由 <网址> --中止       # 阻止请求
浏览器自动化助手 网络 路由 <网址> --响应体 '{}' # 模拟响应
浏览器自动化助手 网络 取消路由 [网址]          # 移除路由
浏览器自动化助手 网络 请求                     # 查看跟踪的请求
浏览器自动化助手 网络 请求 --过滤 api          # 过滤请求

标签页与窗口

浏览器自动化助手 标签页                 # 列出标签页
浏览器自动化助手 标签页 新建 [网址]     # 新建标签页
浏览器自动化助手 标签页 2              # 切换到标签页
浏览器自动化助手 标签页 关闭           # 关闭标签页
浏览器自动化助手 窗口 新建             # 新建窗口

框架

浏览器自动化助手 框架 "#iframe"     # 切换到iframe
浏览器自动化助手 框架 主框架         # 回到主框架

对话框

浏览器自动化助手 对话框 接受 [文本]  # 接受对话框
浏览器自动化助手 对话框 取消         # 取消对话框

JavaScript

浏览器自动化助手 执行 "document.title"   # 运行JavaScript

示例:表单提交

浏览器自动化助手 打开 https://example.com/form
浏览器自动化助手 快照 -i
# 输出显示:文本框 "邮箱" [引用=e1],文本框 "密码" [引用=e2],按钮 "提交" [引用=e3]

浏览器自动化助手 填写 @e1 "用户@example.com"
浏览器自动化助手 填写 @e2 "密码123"
浏览器自动化助手 点击 @e3
浏览器自动化助手 等待 --加载 网络空闲
浏览器自动化助手 快照 -i  # 检查结果

示例:使用保存状态进行身份验证

# 登录一次
浏览器自动化助手 打开 https://app.example.com/login
浏览器自动化助手 快照 -i
浏览器自动化助手 填写 @e1 "用户名"
浏览器自动化助手 填写 @e2 "密码"
浏览器自动化助手 点击 @e3
浏览器自动化助手 等待 --网址 "**/仪表盘"
浏览器自动化助手 状态 保存 认证.json

# 后续会话:加载保存的状态
浏览器自动化助手 状态 加载 认证.json
浏览器自动化助手 打开 https://app.example.com/dashboard

会话 (并行浏览器)

浏览器自动化助手 --会话 测试1 打开 网站-a.com
浏览器自动化助手 --会话 测试2 打开 网站-b.com
浏览器自动化助手 会话 列表

JSON输出 (用于解析)

添加 --json 获取机器可读的输出:

浏览器自动化助手 快照 -i --json
浏览器自动化助手 获取 文本 @e1 --json

调试

浏览器自动化助手 打开 example.com --显示窗口              # 显示浏览器窗口
浏览器自动化助手 控制台                                # 查看控制台消息
浏览器自动化助手 错误                                  # 查看页面错误
浏览器自动化助手 录制 开始 ./调试.webm   # 从当前页面开始录制
浏览器自动化助手 录制 停止                            # 保存录制
浏览器自动化助手 打开 example.com --显示窗口  # 显示浏览器窗口
浏览器自动化助手 --cdp 9222 快照        # 通过CDP连接
浏览器自动化助手 控制台                    # 查看控制台消息
浏览器自动化助手 控制台 --清除            # 清除控制台
浏览器自动化助手 错误                     # 查看页面错误
浏览器自动化助手 错误 --清除             # 清除错误
浏览器自动化助手 高亮 @e1              # 高亮元素
浏览器自动化助手 跟踪 开始                # 开始录制跟踪
浏览器自动化助手 跟踪 停止 跟踪.zip       # 停止并保存跟踪