流畅的浏览器使用
v1.0.0用于操作基于浏览器的工作流,需要流畅、拟人化的导航、可靠的文本输入、真实的粘贴/输入事件、表单验证、翻译器……
0· 0·0 当前·0 累计
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install smooth-browser-use
镜像加速npx clawhub@latest install smooth-browser-use --registry https://cn.longxiaskill.com 镜像可用
技能文档
流畅使用浏览器概览 像细心的人类一样使用浏览器页面:等待真实 UI,点击可见控件,通过页面粘贴,并在继续前验证页面自身状态。
Accessibility set_value 可在不触发页面 paste、input、change、validation、translation、word-count、enable-button 逻辑的情况下使文本可见。将其视为狭窄工具,而非 Web 应用文本输入的默认方式。
当浏览器页面卡住、过期或不同步时,先刷新回到干净初始状态再重试。
流畅工作流
- 加载页面,等待真实应用 UI,而非仅地址栏或空白壳。
- 在导航、重载、用户中断或点击失败后,先用 get_app_state 再交互。
- 优先使用可见控件和键盘操作,而非直接注入 accessibility 值。
- 每次有意义操作后,先验证页面已响应再继续。
- 若页面状态异常,尽早刷新,避免状态恶化。
状态检查 不要只信可见文本。相信页面自身状态指示器:
- 字数/字符计数更新
- 翻译输出变化
- 分析、检测、提交或继续按钮变为可用
- 页面显示完成结果而非占位文本
- 错误横幅在重试或刷新后消失
若可见文本与页面指示器不一致,视为不同步。
文本输入
- 长文本先放系统剪贴板。
- 点击真实可见的输入区、文本区、编辑器或页面提供的 Paste 按钮。
- 用键盘粘贴(macOS 用 Cmd+V)或页面 Paste 按钮,使站点收到真实 paste 事件。
- 替换现有文本时,优先用页面清空/删除控件;若无,则聚焦后 Cmd+A 再粘贴。
- 用页面自身指示器验证已响应;不要仅因 accessibility 树显示值就继续。
- 若页面仍无响应,先失焦再聚焦、按无害导航键,或重新通过页面 Paste 按钮粘贴。
- 若仍不一致,刷新并从干净状态重试。
set_value 仅用于低风险浏览器 chrome 字段(如地址栏)或无需页面逻辑的简易原生字段;避免用于翻译器、检测器、富编辑器、SPA、作业文本框。
页面恢复 当页面空白、加载卡住、显示通用错误或状态过期:
- 刷新一次,等待初始 UI 返回。
- 若仍过期或损坏,再次刷新或在新标签/窗口打开同一 URL。
- 刷新后勿假定旧文本仍有效,清空字段或从页面初始状态开始。
- 按“文本输入”流程重新输入,并再次检查页面指示器。
- 错误屏有可见重试按钮时,先点一次;若未恢复一致状态,刷新页面。
失败信号 出现以下情况即停止并恢复:
- 文本可见但计数器显示 0 字、0 字符或“请输入文本以扫描”
- 检测/分析按钮在文本出现后仍禁用
- 翻译输入有文本却无翻译开始
- 页面提示“Something went wrong”
- accessibility 值变但屏幕应用状态未变
- 导航后页面仍空白
浏览器工具提示
- 用户中断、页面重载或点击失败后,先调用 get_app_state。
- Web 内容优先可见点击 + 键盘操作。
- 长文本用剪贴板 + Cmd+V,避免逐字输入并触发粘贴处理器。
- 每次重要输入后,重新读屏或 accessibility 树,验证 Web 应用已响应。
示例(Baidu Translate)
- 加载或刷新翻译器页面。
- 点击源文本区。
- Cmd+V 粘贴。
- 确认字符计数变化且翻译输出开始更新。
- 若文本出现但翻译未开始,清空字段,刷新,再通过真实 UI 粘贴。