📦 Gemini Skill — 问答与图片生成

Name: Gemini Skill — 问答与图片生成
Rating: 1

v0.1.0

通过 Gemini 官网执行问答和图片生成。支持文本 Q&A 和图片生成，使用最强可用模型（默认 Gemini 3.1 Pro）。

1· 509·1 当前·1 累计

by @wjz-p (WJZ-P)·MIT-0

下载技能包

License

MIT-0

最后更新

2026/3/13

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的请求和指令与其声明的目的相符（自动化 Gemini 网页 UI 用于 Q&A 和图片生成）；仅包含一个小的页面注入辅助脚本，无不相关的凭据或安装要求。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv0.1.02026/3/13

Gemini Skill 初始发布，支持核心网页基于的 Gemini Q&A 和图片生成。- 支持通过 Gemini 网站使用最强可用模型（默认：Gemini 3.1 Pro）进行文本 Q&A 和图片生成。- 检测触发关键词以路由任务：为“问问Gemini”（文本 Q&A）和“生图/画图/nano banana”（图片生成）提供单独的流程。- 提供图片生成期间的用户反馈并相应地返回输出图片或答案。- 包括用于元素检测、模型可用性和超时处理的强固回退逻辑。- 通过快捷脚本和流线化 UI 操作优化低令牌消耗。

● 无害

安装命令

点击复制

官方npx clawhub@latest install gemini-skill

🇨🇳 镜像加速npx clawhub@latest install gemini-skill --registry https://cn.longxiaskill.com

技能文档

核心规则

使用 OpenClaw 内置浏览器，profile="openclaw"。
涉及生图关键词时，优先用无头浏览器流程执行。
文本问答任务走 Gemini 文本提问链路。
默认模型：可用列表中最强模型，优先 Gemini 3.1 Pro。
执行生图后先向用户回报“正在绘图中”，完成后回传图片。

任务分流

文本问答触发词：问问Gemini、让Gemini回答、去Gemini问。
生图任务触发词：生图、画、绘图、海报、nano banana、nanobanana、image generation。
若请求含糊，先确认：是文本回答还是要出图。

标准执行流程

A. 文本问答

打开 https://gemini.google.com。
校验登录态（头像/输入框可见）。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户问题原样输入并发送。
等待完整输出，提炼后回传（必要时附原文要点）。

B. 生图流程

打开 Gemini 页面并确认登录。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户提示词原样输入。
开启/勾选图片生成能力（若 UI 有“生成图片/图片”开关）。
发送后立即通知用户：正在绘图中。
结果出现后：

- 优先用“下载原图”按钮获取原图。 - 若无下载按钮或失败，可对图片右键另存（通常是标清图）。

把图片返回用户；若有多张，按顺序全部回传。

失败回退

元素定位失败：刷新页面后重试一次。
模型不可用：降级到次优 Gemini 模型并告知。
生成超时：回报“仍在生成中”，继续等待一次；再次超时则请用户换短提示词。

低 token 优先策略

优先使用 scripts/gemini_ui_shortcuts.js 的快捷选择器。
先 evaluate 批量动作，再 snapshot 精准兜底。
避免高频全量快照。

参考

详细执行与回退：references/gemini-flow.md
关键词与路由：references/intent-routing.md

数据来源：ClawHub ↗ · 中文优化：龙虾技能库