安全扫描
OpenClaw
安全
high confidence该技能的请求和指令与其声明的目的相符(自动化 Gemini 网页 UI 用于 Q&A 和图片生成);仅包含一个小的页面注入辅助脚本,无不相关的凭据或安装要求。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv0.1.02026/3/13
Gemini Skill 初始发布,支持核心网页基于的 Gemini Q&A 和图片生成。- 支持通过 Gemini 网站使用最强可用模型(默认:Gemini 3.1 Pro)进行文本 Q&A 和图片生成。- 检测触发关键词以路由任务:为“问问Gemini”(文本 Q&A)和“生图/画图/nano banana”(图片生成)提供单独的流程。- 提供图片生成期间的用户反馈并相应地返回输出图片或答案。- 包括用于元素检测、模型可用性和超时处理的强固回退逻辑。- 通过快捷脚本和流线化 UI 操作优化低令牌消耗。
● 无害
安装命令
点击复制官方npx clawhub@latest install gemini-skill
🇨🇳 镜像加速npx clawhub@latest install gemini-skill --registry https://cn.longxiaskill.com
技能文档
核心规则
- 使用 OpenClaw 内置浏览器,
profile="openclaw"。 - 涉及生图关键词时,优先用无头浏览器流程执行。
- 文本问答任务走 Gemini 文本提问链路。
- 默认模型:可用列表中最强模型,优先
Gemini 3.1 Pro。 - 执行生图后先向用户回报“正在绘图中”,完成后回传图片。
任务分流
- 文本问答触发词:
问问Gemini、让Gemini回答、去Gemini问。 - 生图任务触发词:
生图、画、绘图、海报、nano banana、nanobanana、image generation。 - 若请求含糊,先确认:是文本回答还是要出图。
标准执行流程
A. 文本问答
- 打开
https://gemini.google.com。 - 校验登录态(头像/输入框可见)。
- 选择最强可用模型(优先 Gemini 3.1 Pro)。
- 将用户问题原样输入并发送。
- 等待完整输出,提炼后回传(必要时附原文要点)。
B. 生图流程
- 打开 Gemini 页面并确认登录。
- 选择最强可用模型(优先 Gemini 3.1 Pro)。
- 将用户提示词原样输入。
- 开启/勾选图片生成能力(若 UI 有“生成图片/图片”开关)。
- 发送后立即通知用户:正在绘图中。
- 结果出现后:
- 把图片返回用户;若有多张,按顺序全部回传。
失败回退
- 元素定位失败:刷新页面后重试一次。
- 模型不可用:降级到次优 Gemini 模型并告知。
- 生成超时:回报“仍在生成中”,继续等待一次;再次超时则请用户换短提示词。
低 token 优先策略
- 优先使用
scripts/gemini_ui_shortcuts.js的快捷选择器。 - 先 evaluate 批量动作,再 snapshot 精准兜底。
- 避免高频全量快照。
参考
- 详细执行与回退:
references/gemini-flow.md - 关键词与路由:
references/intent-routing.md
数据来源:ClawHub ↗ · 中文优化:龙虾技能库