browser-use AI浏览器自动化
v1.0.0让AI代理控制浏览器自动化网页操作。支持Claude/GPT/Gemini/Ollama,可执行填表、购物、搜索等任务。
详细分析 ▾
运行时依赖
安装命令
点击复制本土化适配说明
browser-use AI浏览器自动化 安装说明: 安装命令:["openclaw skills install browser-use-guide","npx clawhub@latest install browser-use-guide"]
技能文档
browser-use 🌐 让 AI 代理能操控浏览器 GitHub: browser-use/browser-use(90k+ ⭐) License: MIT | Language: Python 3.11+ | 安装:uv
一、核心定位 browser-use 让 AI 代理控制浏览器完成网页自动化,核心理念: Tell your computer what to do, and it gets it done.
二、核心能力 能力 | 说明 填表 | 自动填写表单、求职申请 购物 | 读取购物清单,自动在 Instacart 下单 搜索比价 | 帮用户找 PC 配件、比价 网页操作 | 点击、输入、截图、导航 多平台集成 | Gmail、Slack、Notion 等 1000+ 集成
三、安装 3.1 快速安装(uv)
uv init && uv add browser-use && uv sync
uvx browser-use install # 安装 Chromium
uvx browser-use init --template default
3.2 OpenClaw 集成
cd /root/.openclaw/workspace/skills
git clone https://github.com/browser-use/browser-use.git browser-use
# 或
npx clawhub@latest install browser-use
四、配置 API Key 4.1 环境变量
cat > .env << EOF
BROWSER_USE_API_KEY=your-key
GOOGLE_API_KEY=your-key
ANTHROPIC_API_KEY=your-key
OPENAI_API_KEY=your-key
EOF
4.2 获取地址 服务 | 地址 | 费用 Browser Use Cloud | cloud.browser-use.com | 免费额度 + 按量 Google AI | aistudio.google.com | 免费额度 Anthropic | console.anthropic.com | 按量 OpenAI | platform.openai.com | 按量 Ollama | ollama.com | 免费(本地)
五、快速开始 5.1 基础代码
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="Find the number of stars of the browser-use repo",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
asyncio.run(main())
5.2 指定 LLM
from browser_use import ChatGoogle, ChatAnthropic, ChatOllama
agent = Agent(task="...", llm=ChatGoogle(model='gemini-3-flash-preview'), browser=browser)
agent = Agent(task="...", llm=ChatAnthropic(model='claude-sonnet-4-6'), browser=browser)
agent = Agent(task="...", llm=ChatOllama(model='llama3'), browser=browser)
六、CLI
browser-use open https://example.com
browser-use state
browser-use click 5
browser-use type "Hello World"
browser-use screenshot page.png
browser-use close
模板生成
uvx browser-use init --template default
uvx browser-use init --template advanced
uvx browser-use init --template tools
七、自定义工具
from browser_use import Tools
tools = Tools()
@tools.action(description='获取指定 GitHub 仓库的星数')
def get_github_stars(repo: str) -> str:
import requests
r = requests.get(f"https://api.github.com/repos/{repo}")
return r.json().get("stargazers_count", "Unknown")
八、认证与持久化 8.1 复用 Chrome
browser = Browser(chrome_instance_path="/path/to/chrome")
8.2 同步云端
curl -fsSL https://browser-use.com/profile.sh | BROWSER_USE_API_KEY=XXXX sh
九、云端 vs 开源 特性 | 开源版 | 云端版(推荐) 费用 | 免费(自备 LLM API) | 免费额度 + 按量 Stealth | ❌ 需自配 | ✅ Proxy 轮换 + CAPTCHA 解决 维护 | 自运维 | ✅ 全托管 自定义工具 | ✅ 深度集成 | ✅ 支持 并发 | 受本地限制 | ✅ 可水平扩展
十、场景示例 求职申请、购物、比价搜索(代码同上)
十一、故障排除 问题 | 方案 Chromium 未安装 | uvx browser-use install API Key 报错 | 检查 .env 浏览器无法启动 | chrome --version 被网站检测 | 用云端版 Browser(use_cloud=True) 任务失败 | 增加 max_steps
十二、OpenClaw 集成 12.1 MCP
npx clawhub@latest install browser-use-mcp
openclaw mcp add browser-use --command "python -m browser_use.mcp"
12.2 Claude Code Skill
mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md
十三、费用参考 ChatBrowserUse(每 1M tokens) 输入 $0.20 | 缓存输入 $0.02 | 输出 $2.00
模型对比 bu-30b-a3b-preview(Browser Use 专用) claude-sonnet-4-6、gemini-3-flash-preview、llama3(Ollama 免费)
十四、使用方式 用户说「帮我自动填表」→ 触发填表示例 用户说「自动帮我购物」→ 触发购物示例 用户说「AI 控制浏览器」→ 展示能力 用户说「安装 browser-use」→ 执行安装 用户说「配置 API key」→ 执行配置
组合:求职申请自动化 → 分析表单 → 调用 Agent → 配置 LLM → 自动填表 + 上传简历
十五、关联技能