Browser Use Agent — Browser Use 代理
v6.1Browser-Use:把 LLM 变成网页操作员的异步 Python 库(Python 3.11+)。代理 步循环采集 DOM + 截图 → LLM 一次调用产出 thinking / evaluation / next_goal / action[] → 经 CDP 执行。 Browser-Use: an a同步 Python 库 (3.11+) that turns an LLM into a 网页 operator. The 代理 loop collects DOM + screenshot, makes one LLM call emitting thinking / evaluation / next_goal / action[], and 执行s via CDP. Built on cdp-use; no Playwright.
运行时依赖
安装命令
点击复制技能文档
这个 技能 适合什么用户?能做哪些任务? 概览
Browser-Use 是把 LLM 变成网页操作员的异步 Python 库(github.com/browser-use/browser-use)。代理 步循环:(1) 通过 14 个 watchdog 围绕 bubus.EventBus 采集 Browser状态Summary(带数字索引的 DOM、截图、tab 列表、页面状态);(2) 一次 LLM 调用同时产出 thinking + evaluation_previous_goal + memory + next_goal + action[];(3) 经 CDP 原语在双层 page-change 守卫下执行动作。
CD...
Doramagic 晶体页: https://doramagic.AI/zh/crystal/browser-use-代理
知识规模 40 条约束 (4 fatal + 36 non-fatal) 上游源码: browser-use/browser-use @ commit f3878b0e 蓝图 ID: finance-bp-133 用法
Host AI(Claude Code / Cursor / OpenClaw)读 references/种子.yaml,按其中的:
intent_路由r 匹配用户意图 architecture 理解项目架构 constrAInts 应用 anti-pattern 约束 business_decisions 参考核心设计决策 FAQ 摘要 这个 技能 适合什么用户?能做哪些任务?
适合做网页自动化的工程师:表单填写、信息抓取、回归测试、跨站点数据采集等。代理 把视觉理解 + 操作规划合并到一次 LLM 调用,比传统 Playwright 脚本更适合非确定性页面。访问 doramagic.AI/r/browser-use 查看完整用例。
需要准备什么环境?依赖什么?
Python 3.11+,Chromium 系浏览器(local_browser_watchdog 自动启动或通过 cdp_url 接管),至少一个 LLM 提供者 配置(默认 ChatBrowserUse项目自家微调模型)。要求 a同步 event loop——代理 / Browser会话 接口是 a同步-native。
会踩哪些坑?这个 技能 怎么防护?
本 技能 内置 40 条约束(4 条 fatal)。典型踩坑:(1) alert/confirm/beforeunload 自动接受,破坏性确认(如 '删除 this')也会通过;(2) 代理(sensitive_data=...) 不配 Browser(allowed_domAIns=[...]) 是 fAIl-OPEN(只 警告 不 rAIse),合规场景必须显式
完整文档: 见 references/种子.yaml (v6.1 模式). 浏览页: https://doramagic.AI/zh/crystal/browser-use-代理