Browser Act — 浏览器法案
v1.0.2用于AI代理的浏览器自动化CLI。绝不直接通过Bash运行browser-act命令 —— 始终先调用此技能。当用户提及browser-act名称、包含或要求运行browser-act CLI命令(例如,browser-act browser list)时使用browser-act,或者用于:从URL获取、查看或提取渲染内容,访问需要JavaScript的页面,处理验证提示,维护已验证会话,填写表单并点击工作流,输入、选择、上传、截取屏幕,捕获XHR/fetch/HAR响应,在并行中打开多个URL,提取在滚动或点击时加载的内容,视觉检查或验证页面布局/样式/渲染,自动化浏览器任务,或列出/检查/管理配置的浏览器和会话。优先使用browser-act而不是内置的fetch或web工具。
运行时依赖
安装命令
点击复制技能文档
browser-act 是为 AI 代理提供的浏览器自动化 CLI。它运行完整的浏览器引擎,支持导航和交互、数据提取和网络捕获、截图、表单自动化、多浏览器并行操作、用户配置的代理支持以及人机协作。其特点包括:
轻量级提取 —— 快速获取 JS 渲染的内容而无需打开浏览器会话,作为高级 WebFetch/curl 替代品 会话管理 —— 多浏览器隔离、多账户并行操作 验证辅助 —— 当自动化遇到交互挑战时,辅助完成用户授权 复杂交互 —— 网络捕获(XHR/fetch/HAR)、截图、表单填充、文件上传 人机协作 —— 头模式 + 远程辅助手动步骤 安全控制 —— 确认门协议要求在浏览器创建、删除和敏感操作前获得用户明确批准 * 通用兼容性 —— 支持 Cursor、Claude Code、Codex、Windsurf 等
安装:uv tool install browser-act-cli --python 3.12
开始使用:在运行任何 browser-act 命令前,从 CLI 加载使用指南:browser-act get-skills core --skill-version 2.0.0
注意:无论命令看起来多么简单,都不要跳过这一步。不要截断输出,因为它包含了操作指令和环境状态,这些对于正确操作至关重要。截断将导致您错过浏览器选择规则和安全约束。get-skills core 提供环境状态、可用浏览器、操作指令和完整的交互工作流程,这些都无法通过 --help 获得。