yumweb — yum 网页版
v0.1.0使用已经登录的 Edge/Chrome/Chromium 浏览器作为代理的“手”。一个用于 OpenClaw、Copilot CLI、Claude Code、Hermes 等本地 AI 代理的持久登录浏览器桥接。使用场景:打开浏览器,重用已登录的网站,检查 X/Gmail/Outlook/Amazon/LinkedIn/Facebook/Instagram/WeChat Web,阅读网页,切换标签页,点击,输入,获取页面,浏览器自动化。
运行时依赖
安装命令
点击复制技能文档
yumweb — 登录浏览器桥接器,用于 AI 代理 平台:Windows / macOS / Linux,支持任何基于 Chromium 的浏览器(首选 Microsoft Edge;也支持 Chrome 和 Chromium 自动检测)。 Python:仅支持 64 位 —— Playwright 的 greenlet 依赖没有 32 位 Windows 轮子。 一个专用的基于 Chromium 的浏览器实例,启用了 Chrome DevTools Protocol (CDP),运行在端口 9333 上,拥有自己的用户数据目录 —— 默认情况下与日常浏览器分开。 Cookie 在运行之间保持,因此您只需登录一次(例如,登录 x.com、Gmail、Outlook、Amazon、LinkedIn、Facebook、Instagram 或 WeChat Web),然后在后续的代理会话中保持登录状态。 当多个标签页打开时,yumweb 保留最后一个显式激活的标签页(标签切换、标签新建、前往、x 读取等),因此后续命令如读取、点击和输入可以更可靠地定位目标页面。 此技能暴露了一个单一的 Python 脚本(scripts/yumweb.py,Playwright 后端),任何 AI 代理(OpenClaw、Copilot CLI、Claude Code、Hermes 等)都可以外壳到它,以便: 打开 URL、读取页面内容作为文本或 markdown、点击和输入、截取屏幕、运行 JavaScript 并在真实登录的网站中操作。 为什么这个技能存在 大多数浏览器工具都专注于控制浏览器。yumweb 专注于保存一个持久的、登录的浏览器世界,代理可以稍后返回。 这使得它对个人助理风格的任务很有用,例如: 检查 X / LinkedIn / Facebook 的动态 阅读 Gmail / Outlook 的收件箱 打开 Amazon 的产品页面或购物车 重新访问 WeChat Web 或其他已经认证的网站 为什么需要一个单独的浏览器? 不会与您日常工作使用的浏览器实例冲突。 在 ./profile/ 中有一个持久的配置文件 —— 登录一次,保持 Cookie 在运行之间(将该目录视为凭据;捆绑的 .gitignore 将其排除在 git 之外)。 默认情况下是有头的,因此您可以看到发生了什么并手动登录。 一次性 CLI —— 每个命令都附加、执行并退出。 多代理 / 跨浏览器 —— 与 OpenClaw、Copilot CLI、Claude Code、Hermes 和基于 Chromium 的浏览器(如 Edge 和 Chrome)配合良好。 设置 请参阅 README.md 以获取完整的安装说明。 快速版本:python -m pip install playwright html2text requests python scripts\yumweb.py start 手动登录 x.com(或您想要缓存 Cookie 的任何网站)。 start 是幂等的 —— 再次运行它如果 Edge 已经启动,则无操作。 命令 命令描述 start 启动 Edge,带有 --remote-debugging-port=9333 和专用配置文件。分离。 stop 杀死 Edge 实例(仅端口 9333) status 显示 Edge 是否启动、当前 URL 和标签列表 goto 导航活动标签到 URL(等待加载) read [--mode text|md|html] [--selector CSS] [--max N] 获取页面文本 / markdown / HTML。默认:文本、body、最大 8000 个字符 fetch 快捷方式:goto && read --mode md click 点击第一个匹配 CSS 选择器的元素 type [--enter] 聚焦选择器,输入文本(可选按 Enter) screenshot 保存 PNG 屏幕截图 eval 在活动标签中运行 JavaScript,打印 JSON 结果 tabs 列出所有打开的标签(索引、标题、URL) tab-new 打开新标签 tab-switch 切换活动标签 tab-close 关闭标签 x-read [--user ] [--n 20] 读取主时间线或用户配置文件的推文 x-post 发布新推文(需要先登录) 所有命令都将输出打印到 stdout。错误将打印到 stderr,带有非零退出代码。 示例: 快速读取任何 URL(markdown 格式,适合 LLM) python scripts\yumweb.py fetch https://example.com 读取您的主时间线 python scripts\yumweb.py x-read --n 10 读取某人的推文 python scripts\yumweb.py x-read --user satyanadella --n 5 发布推文 python scripts\yumweb.py x-post "Hello from CLI" 点击按钮 python scripts\yumweb.py click "button[data-testid='login']" 搜索框:输入和按 Enter python scripts\yumweb.py type "input[name=q]" "GB200 firmware" --enter AI 工具如何使用此技能 当用户要求“检查 X 上的 XYZ”、“前往此 URL”、“发布推文关于 Y”或任何与网页浏览相关的内容时: 运行 ./scripts/run.sh status(或 python scripts\yumweb.py status 在 Windows 上) —— 如果没有运行,则启动。 使用 fetch 进行快速读取(LLM 友好 markdown 输出)。 使用 x-read / x-post 进行 X。 在多个标签页打开时,使用 tab-switch 在读取 / 点击 / 输入之前。 使用 eval 进行任何自定义操作(返回必须是 JSON 可序列化的)。 输出为纯文本,准备好总结回给用户。 文件 scripts/yumweb.py —— 主脚本(Playwright 后端) scripts/config.json —— 端口、配置文件目录、edge.exe 路径(路径为空 → 自动解析到此技能旁边) profile/ —— Edge 用户数据目录(在第一次启动时创建,gitignore) logs/yumweb.log —— 启动的 Edge 的 stderr(gitignore) logs/active_tab.json —— 最后活动标签的元数据,用于使后续命令定位目标页面 依赖 64 位 Python 3.10+ playwright(>= 1.40)—— 附加到现有的 ...