name: agent-browser description: 通过自动化浏览器交互实现表单填写和网页交互。被 request-website 命令用于提交网站索引请求。
使用 agent-browser 进行浏览器自动化
快速开始
agent-browser open <url> # 导航到页面
agent-browser snapshot -i # 获取带有引用标识的交互元素
agent-browser click @e1 # 通过引用标识点击元素
agent-browser fill @e2 "text" # 通过引用标识填写输入框
agent-browser close # 关闭浏览器
核心工作流程
- 导航:
agent-browser open <url> - 快照:
agent-browser snapshot -i(返回带有引用标识的元素,如@e1,@e2) - 使用快照中的引用标识进行交互
- 导航或DOM发生重大变化后重新快照
- 务必关闭:
agent-browser close
命令
导航
agent-browser open <url> # 导航到URL
agent-browser close # 关闭浏览器(务必执行此操作)
快照(页面分析)
agent-browser snapshot # 完整的无障碍访问树
agent-browser snapshot -i # 仅交互元素(推荐)
交互(使用快照中的@引用标识)
agent-browser click @e1 # 点击
agent-browser fill @e2 "text" # 清空并输入
agent-browser type @e2 "text" # 不清空直接输入
agent-browser press Enter # 按键
agent-browser scroll down 500 # 滚动页面
获取信息
agent-browser get text @e1 # 获取元素文本
agent-browser get title # 获取页面标题
agent-browser get url # 获取当前URL
等待
agent-browser wait @e1 # 等待元素出现
agent-browser wait 2000 # 等待毫秒数
agent-browser wait --load networkidle # 等待网络空闲
示例: 表单提交(request-website)
# 打开Actionbook请求页面
agent-browser open "https://actionbook.dev/request-website"
# 获取表单元素
agent-browser snapshot -i
# 输出显示: 文本框 "Site URL" [ref=e1], 文本框 "Email" [ref=e2], 文本框 "Use Case" [ref=e3], 按钮 "Submit" [ref=e4]
# 填写表单
agent-browser fill @e1 "https://example.com/products"
agent-browser fill @e2 "user@example.com"
agent-browser fill @e3 "Scraping product catalog"
# 提交
agent-browser click @e4
agent-browser wait --load networkidle
# 验证提交
agent-browser snapshot -i
# 关闭浏览器
agent-browser close
所需权限
添加到 .claude/settings.local.json:
{
"permissions": {
"allow": [
"Bash(agent-browser *)"
]
}
}
或运行 ./setup.sh 自动配置。