运行时依赖
版本
命令
安装命令
点击复制技能文档
浏览器自动化与 agent-browser 快速开始 agent-browser open # 导航到页面 agent-browser snapshot -i # 获取交互元素及其引用 agent-browser click @e1 # 点击元素 agent-browser fill @e2 "text" # 填充输入框 agent-browser close # 关闭浏览器 核心工作流程 导航:agent-browser open 快照:agent-browser snapshot -i (返回带有引用(如 @e1、@e2)的元素) 使用快照中的引用进行交互 在导航或显著的 DOM 更改后重新快照 命令 导航 agent-browser open # 导航到 URL(别名:goto、navigate) # 支持:https://、http://、file://、about://、data:// # 如果没有指定协议,自动添加 https:// agent-browser back # 后退 agent-browser forward # 前进 agent-browser reload # 重新加载页面 agent-browser close # 关闭浏览器(别名:quit、exit) agent-browser connect 9222 # 通过 CDP 端口连接到浏览器 快照(页面分析) agent-browser snapshot # 完整的可访问性树 agent-browser snapshot -i # 仅交互元素(推荐) agent-browser snapshot -c # 紧凑输出 agent-browser snapshot -d 3 # 限制深度到 3 agent-browser snapshot -s "#main" # 限制到 CSS 选择器 交互(使用快照中的引用) agent-browser click @e1 # 点击 agent-browser dblclick @e1 # 双击 agent-browser focus @e1 # 聚焦元素 agent-browser fill @e2 "text" # 清除并输入文本 agent-browser type @e2 "text" # 输入文本(不清除) agent-browser press Enter # 按键(别名:key) agent-browser press Control+a # 按键组合 agent-browser keydown Shift # 按下键 agent-browser keyup Shift # 释放键 agent-browser hover @e1 # 悬停 agent-browser check @e1 # 选中复选框 agent-browser uncheck @e1 # 取消选中复选框 agent-browser select @e1 "value" # 选择下拉选项 agent-browser select @e1 "a" "b" # 选择多个选项 agent-browser scroll down 500 # 滚动页面(默认:向下 300px) agent-browser scrollintoview @e1 # 滚动元素到视图(别名:scrollinto) agent-browser drag @e1 @e2 # 拖拽 agent-browser upload @e1 file.pdf # 上传文件 获取信息 agent-browser get text @e1 # 获取元素文本 agent-browser get html @e1 # 获取 innerHTML agent-browser get value @e1 # 获取输入值 agent-browser get attr @e1 href # 获取属性 agent-browser get title # 获取页面标题 agent-browser get url # 获取当前 URL agent-browser get count ".item" # 计数匹配元素 agent-browser get box @e1 # 获取边界框 agent-browser get styles @e1 # 获取计算样式(字体、颜色、背景等) 检查状态 agent-browser is visible @e1 # 检查是否可见 agent-browser is enabled @e1 # 检查是否启用 agent-browser is checked @e1 # 检查是否选中 截图和 PDF agent-browser screenshot # 截图到标准输出 agent-browser screenshot path.png # 保存到文件 agent-browser screenshot --full # 全页截图 agent-browser pdf output.pdf # 保存为 PDF 视频录制 agent-browser record start ./demo.webm # 开始录制(使用当前 URL + 状态) agent-browser click @e1 # 执行操作 agent-browser record stop # 停止并保存视频 agent-browser record restart ./take2.webm # 停止当前录制并开始新录制 录制创建一个新的上下文,但保留会话中的 cookie 和存储。如果没有提供 URL,自动返回到当前页面。为了获得顺畅的演示,请先探索,然后开始录制。 等待 agent-browser wait @e1 # 等待元素 agent-browser wait 2000 # 等待毫秒 agent-browser wait --text "Success" # 等待文本(或 -t) agent-browser wait --url "**/dashboard" # 等待 URL 模式(或 -u) agent-browser wait --load networkidle # 等待网络空闲(或 -l) agent-browser wait --fn "window.ready" # 等待 JS 条件(或 -f) 鼠标控制 agent-browser mouse move 100 200 # 移动鼠标 agent-browser mouse down left # 按下按钮 agent-browser mouse up left # 释放按钮 agent-browser mouse wheel 100 # 滚动轮 语义定位器(替代引用) agent-browser find role button click --name "Submit" agent-browser find text "Sign In" click agent-browser find text "Sign In" click --exact # 精确匹配 agent-browser find label "Email" fill "user@test.com" agent-browser find placeholder "Search" type "query" agent-browser find alt "Logo" click agent-browser find title "Close" click agent-browser find testid "submit-btn" click agent-browser find first ".item" click agent-browser find last ".item" click