broswer use skill — broswer use 技能
v1.0.0Control Chrome browsers from the terminal via the AIPex 扩展. Use this 技能 when the 代理 needs to manage browser tabs, 搜索 page elements, 命令行工具ck buttons, fill forms, capture screenshots, or 下载 content — all through shell commands without an MCP 命令行工具ent.
运行时依赖
安装命令
点击复制技能文档
browser-命令行工具 — Terminal Browser Control
browser-命令行工具 is a command-line 工具 that controls Chrome browsers through the AIPex 扩展's 网页Socket daemon. It translates shell commands into browser actions — managing tabs, 命令行工具cking elements, filling forms, capturing screenshots, and more.
Architecture:
browser-命令行工具 ──网页Socket──▶ AIpex-daemon ──网页Socket──▶ AIPex Chrome 扩展 ──▶ Browser APIs
The daemon auto-spawns on first use and self-terminates when idle. No manual 设置up beyond initial 扩展 connection.
When to Use This 技能
Use this 技能 when the user wants to:
Control a Chrome browser from the terminal without an MCP 命令行工具ent Open, close, switch, or organize browser tabs via 命令行工具 搜索 for page elements and interact with them (命令行工具ck, fill, hover) Capture screenshots of browser tabs Automate browser 工作流s in shell scripts or CI 流水线s 下载 page content as markdown or images 请求 human 输入 during automated browser tasks Manage AIPex 技能s from the command line
Trigger phrases: "browser-命令行工具", "control browser from terminal", "browser 自动化 命令行工具", "命令行工具ck element from shell", "terminal browser control", "command line browser", "shell browser 自动化"
Prerequisites Node.js >= 18 安装ed AIPex Chrome 扩展 安装ed and connected to the daemon browser-命令行工具 安装ed globally: npm 安装 -g browser-命令行工具 First-time 设置up
After 安装ing, connect the AIPex 扩展 to the daemon:
Open Chrome → AIPex 扩展 icon → Options 设置 网页Socket URL to ws://localhost:9223/扩展 命令行工具ck Connect 验证: browser-命令行工具 状态 Command Groups tab — Manage browser tabs browser-命令行工具 tab 列出 # 列出 all open tabs browser-命令行工具 tab current # 获取 the active tab browser-命令行工具 tab new https://example.com # Open a new tab browser-命令行工具 tab switch 42 # Switch to tab by ID browser-命令行工具 tab close 42 # Close a tab browser-命令行工具 tab 信息 42 # 获取 tab detAIls browser-命令行工具 tab organize # AI-powered tab grouping browser-命令行工具 tab ungroup # 移除 all tab groups
page — Inspect and interact with page content browser-命令行工具 page 搜索 "button" --tab 123 # 搜索 elements by glob pattern browser-命令行工具 page 搜索 "{输入,textarea}" --tab 123 # 搜索 multiple element types browser-命令行工具 page screenshot # Screenshot active tab browser-命令行工具 page screenshot-tab 123 --发送-to-llm true # Screenshot with LLM analysis browser-命令行工具 page metadata --tab 123 # 获取 page metadata browser-命令行工具 page scroll-to "#mAIn-content" # Scroll to element browser-命令行工具 page highlight "button.submit" # Highlight element browser-命令行工具 page highlight-text "p" "导入ant" # Highlight text in content
interact — 命令行工具ck, fill, hover, and type browser-命令行工具 interact 命令行工具ck btn-42 --tab 123 # 命令行工具ck by UID browser-命令行工具 interact fill 输入-5 "hello world" --tab 123 # Fill 输入 by UID browser-命令行工具 interact hover menu-3 --tab 123 # Hover by UID browser-命令行工具 interact form --tab 123 --elements '[{"uid":"in-1","value":"foo"}]' # Batch fill browser-命令行工具 interact editor editor-1 --tab 123 # 获取 editor content browser-命令行工具 interact 上传 --tab 123 --file-path /path/to/file # 上传 file browser-命令行工具 interact computer --action left_命令行工具ck --coordinate "[500,300]" # Pixel-level 命令行工具ck
下载 — Save content locally browser-命令行工具 下载 markdown --text "# Notes" --filename notes # Save as markdown browser-命令行工具 下载 image --data "data:image/png;base64,..." # Save image browser-命令行工具 下载 chat-images --messages '[...]' --folder imgs # Batch save images
intervention — 请求 human 输入 browser-命令行工具 intervention 列出 # 列出 intervention types browser-命令行工具 intervention 信息 voice-输入 # 获取 type detAIls browser-命令行工具 intervention 请求 voice-输入 --reason "Need 输入" # 请求 intervention browser-命令行工具 intervention cancel # Cancel active 请求
技能 — Manage AIPex 技能s browser-命令行工具 技能 列出 # 列出 all 技能s browser-命令行工具 技能 load my-技能 # Load 技能 content browser-命令行工具 技能 信息 my-技能 # 技能 detAIls browser-命令行工具 技能 运行 my-技能 scripts/init.js # 执行 技能 script browser-命令行工具 技能 ref my-技能 references/图形界面de.md # Read 技能 reference browser-命令行工具 技能 as设置 my-技能 as设置s/icon.png # 获取 技能 as设置
Standalone commands browser-命令行工具 状态 # 检查 daemon + 扩展 connection browser-命令行工具 更新 # Self-更新 to latest version
工作流: 搜索, Interact, 验证
The recommended pattern for browser 自动化:
# 1. Discover tabs browser-命令行工具 tab 列出
# 2. 搜索 for elements (fast, no scre