📦 Gemini Skill — 问答与图片生成

v0.1.0

通过 Gemini 官网执行问答和图片生成。支持文本 Q&A 和图片生成,使用最强可用模型(默认 Gemini 3.1 Pro)。

1· 509·1 当前·1 累计
by @wjz-p (WJZ-P)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/13
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的请求和指令与其声明的目的相符(自动化 Gemini 网页 UI 用于 Q&A 和图片生成);仅包含一个小的页面注入辅助脚本,无不相关的凭据或安装要求。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.1.02026/3/13

Gemini Skill 初始发布,支持核心网页基于的 Gemini Q&A 和图片生成。- 支持通过 Gemini 网站使用最强可用模型(默认:Gemini 3.1 Pro)进行文本 Q&A 和图片生成。- 检测触发关键词以路由任务:为“问问Gemini”(文本 Q&A)和“生图/画图/nano banana”(图片生成)提供单独的流程。- 提供图片生成期间的用户反馈并相应地返回输出图片或答案。- 包括用于元素检测、模型可用性和超时处理的强固回退逻辑。- 通过快捷脚本和流线化 UI 操作优化低令牌消耗。

无害

安装命令

点击复制
官方npx clawhub@latest install gemini-skill
🇨🇳 镜像加速npx clawhub@latest install gemini-skill --registry https://cn.longxiaskill.com

技能文档

核心规则

  • 使用 OpenClaw 内置浏览器,profile="openclaw"
  • 涉及生图关键词时,优先用无头浏览器流程执行。
  • 文本问答任务走 Gemini 文本提问链路。
  • 默认模型:可用列表中最强模型,优先 Gemini 3.1 Pro
  • 执行生图后先向用户回报“正在绘图中”,完成后回传图片。

任务分流

  • 文本问答触发词:问问Gemini让Gemini回答去Gemini问
  • 生图任务触发词:生图绘图海报nano bananananobananaimage generation
  • 若请求含糊,先确认:是文本回答还是要出图。

标准执行流程

A. 文本问答

  • 打开 https://gemini.google.com
  • 校验登录态(头像/输入框可见)。
  • 选择最强可用模型(优先 Gemini 3.1 Pro)。
  • 将用户问题原样输入并发送。
  • 等待完整输出,提炼后回传(必要时附原文要点)。

B. 生图流程

  • 打开 Gemini 页面并确认登录。
  • 选择最强可用模型(优先 Gemini 3.1 Pro)。
  • 将用户提示词原样输入。
  • 开启/勾选图片生成能力(若 UI 有“生成图片/图片”开关)。
  • 发送后立即通知用户:正在绘图中。
  • 结果出现后:
- 优先用“下载原图”按钮获取原图。 - 若无下载按钮或失败,可对图片右键另存(通常是标清图)。
  • 把图片返回用户;若有多张,按顺序全部回传。

失败回退

  • 元素定位失败:刷新页面后重试一次。
  • 模型不可用:降级到次优 Gemini 模型并告知。
  • 生成超时:回报“仍在生成中”,继续等待一次;再次超时则请用户换短提示词。

低 token 优先策略

  • 优先使用 scripts/gemini_ui_shortcuts.js 的快捷选择器。
  • 先 evaluate 批量动作,再 snapshot 精准兜底。
  • 避免高频全量快照。

参考

  • 详细执行与回退:references/gemini-flow.md
  • 关键词与路由:references/intent-routing.md
数据来源:ClawHub ↗ · 中文优化:龙虾技能库