📦 GPT Image 2

v1.0.4

PPT Generator 通过 OpenAI 的 gpt-image-2 生成视觉冲击力强的 PPT 幻灯片——10 款精选风格(Spatial Glass / Tech Blue / Editorial Mono / Dark Aurora / Risograph / W...)

0· 11·0 当前·0 累计
by @juneyaooo (JuneYaooo)·Apache
下载技能包
License
Apache
最后更新
2026/4/22
0
安全扫描
VirusTotal
Pending
查看报告
OpenClaw
可疑
medium confidence
该包基本实现了 README/SKILL.md 所述功能(通过 OpenAI 图像 + 可选视觉提供商生成 PPT 幻灯片),但存在多处内部不一致(manifest 声明无需 env 变量/仅指令,而代码和安装脚本却要求 OpenAI API 密钥并包含大量代码文件),且 SKILL.md 中检测到提示注入模式——安装或授予密钥前请审查。
评估建议
该技能看似实现了其宣称的功能(通过调用图像/视觉 LLM 创建 PPT),但存在多处红旗,安装或提供 API 密钥前务必谨慎: 1) Manifest 不匹配——注册元数据声称无需环境变量、仅依赖指令,但代码和 README 要求 OPENAI_API_KEY(以及可选的 VISION_*)。请将此包视为会调用外部端点并发送幻灯片内容的代码。 2) SKILL.md 含有隐藏 Unicode 控制字符(提示注入信号)——使用前请用十六进制编辑器打开或运行 `cat -v` 检查隐藏字符。 3) 提示词与输入会被保存到 prompts.json 及其他本地缓存;若数据敏感,请勿运行,除非你接受这些文件存在且可能被共享。 4) 仅提供你信任的 API 密钥和 base_url;工具会将内容发送至所配置的端点。 5) 若决定安装:请在隔离环境(容器/一次性 VM)中进行,审查 generate_ppt.py 和 image_generator.py 是否有额外网络调用,并优先将 OPENAI_BASE_URL 设为官方服务商或你控制的转发地址。如无法验证仓库来源或 SKIL...
详细分析 ▾
用途与能力
该技能的注册元数据声明“所需环境变量:无”且“无安装规范 — 仅指令”,但 bundle 内包含可运行的 Python 代码、安装脚本以及明确要求 OPENAI_API_KEY(以及可选的 VISION_* 变量)的 SKILL.md/README。这种 manifest 声称无需凭据而代码却需要 API 密钥的不一致应由发布者解决。
指令范围
运行时指令与代码通常限定于所述用途:接收 slides_plan.json,可选 .pptx 模板,将模板页渲染为 PNG,调用配置的 OpenAI 兼容 Images/chat 端点(gpt-image-2)及可选视觉模型,下载返回图片,组装 HTML 查看器与 .pptx。SKILL.md/代码在调用者当前工作目录下写入输出并缓存。注意两点:(1) SKILL.md 及预扫描检测到其中存在“unicode-control-chars”(提示注入模式),可能隐藏/混淆文本;(2) prompts.json 包含所用完整提示(含用户提供的幻灯片文本),以明文本地存储,若共享可能泄露敏感内容。
安装机制
没有 registry “install” 规范,但仓库提供了 install_as_skill.sh,它会将文件复制到 ~/.claude/skills/... 并执行 pip install -r requirements.txt。这是标准的本地安装流程(无晦涩的第三方下载地址),不过安装器可能会还原已有的 .env,并在本地未安装 LibreOffice 时拉取较大的 docker 镜像(linuxserver/libreoffice)。除常规的 pip/docker 使用外,未发现任意远程代码下载迹象。
凭证需求
代码需要 OPENAI_API_KEY / OPENAI_BASE_URL(若使用 template-clone 模式,还可选 VISION_API_KEY / VISION_BASE_URL)。这些环境变量与所述功能(调用图像+视觉端点)成正比,但注册元数据错误地列出“所需环境变量:无”。这一差异至关重要:该 Skill 需要你的 API 密钥,并会将用户内容发送至你配置的 base_url。没有无关凭证(如 AWS 等),因此所请求的密钥在功能上是合理的,但清单遗漏具有误导性。
持久化与权限
该 skill 未设置 always:true,不会强制自启。它将缓存与输出写入调用方 cwd 下的显式每次运行路径(template_renders/、template_cache/、outputs/);若已安装,使用本地 ~/.claude/skills 位置,不修改其他 skill 或全局代理设置。自主调用(disable-model-invocation=false)为平台默认,本身并非此处独有风险。
安全有层次,运行前请审查代码。

License

Apache

请查看许可证条款了解详情。

运行时依赖

无特殊依赖

版本

latestv1.0.42026/4/22

清除所有 .md / .py / .yaml 文件中的非 ASCII 花哨标点(em/en 破折号、箭头、⚠/ℹ、制表符)以通过 ClawHub 的宽 unicode-control-chars 启发式检测,保留 CJK。

Pending

安装命令

点击复制
官方npx clawhub@latest install gpt-image2-ppt
镜像加速npx clawhub@latest install gpt-image2-ppt --registry https://cn.longxiaskill.com

技能文档

把 markdown 大纲或 slides_plan.json + 视觉风格喂给 OpenAI Images API(gpt-image-2),逐页出图,最终拼成键盘翻页 HTML viewer 与 16:9 .pptx。

10 套内置风格

| 风格 ID | 关键词 | 适用场景 | |---|---|---| | gradient-glass | Apple Vision OS 空间玻璃 | AI 发布、技术分享、创意提案 | | clean-tech-blue | Stripe / Linear 蓝白 | 融资路演、商业计划 | | vector-illustration | 复古矢量描边 | 教育、品牌故事 | | editorial-mono | Kinfolk 编辑感 | 品牌发布、文化访谈 | | dark-aurora | Linear / Vercel 深霓虹 | AI 产品、开发者工具 | | risograph | Riso 双色调网点 | 文创、独立 zine | | japanese-wabi | 原研哉侘寂 | 茶道、奢侈品、文化讲座 | | swiss-grid | 国际主义网格 | 学术报告、博物馆级汇报 | | hand-sketch | 白板手绘 | 工作坊、头脑风暴 | | y2k-chrome | 千禧液态金属 | 潮牌、Z 世代营销 |

选型速查:技术类选 dark-aurora / gradient-glass;商务类选 clean-tech-blue / editorial-mono;文化生活选 japanese-wabi / vector-illustration;潮文娱选 risograph / y2k-chrome;学术选 swiss-grid;早期创意选 hand-sketch

模板克隆模式

给 skill 一个 .pptx,后续全仿它。 ``bash python3 generate_ppt.py \ --plan slides_plan.json \ --template-pptx ./company-template.pptx \ --template-strict ` --template-strict 每页以模板对应页为 image reference 喂给 gpt-image-2,仿真度最高。

模板渲染(无需 PowerPoint)

skill 自带
render_template.py,自动把 .pptx 转 PNG 存 /template_renders//page-NN.png。 优先级:
  • 本机 libreoffice / soffice
  • docker + linuxserver/libreoffice(首次拉 ~2.5 GB)
  • PDF→PNG(pymupdf / pdf2image

无 LibreOffice 时,可手动导出 PNG 命名 page-01.png 起。

两层缓存

| 资源 | 路径 | 说明 | |---|---|---| | 模板 PNG | template_renders//page-NN.png | 一次渲染长期复用 | | Vision 分析 | template_cache/.json | gemini-3.1-pro-preview 一次分析长期复用 | | 输出 | outputs// | 每次新目录 |

建议将以上目录加入 .gitignore

安装

`bash git clone git@github.com:JuneYaooo/gpt-image2-ppt-skills.git cd gpt-image2-ppt-skills bash install_as_skill.sh # 编辑 ~/.claude/skills/gpt-image2-ppt-skills/.env 填 API_KEY `

必需环境变量

`bash OPENAI_BASE_URL=https://api.openai.com OPENAI_API_KEY=sk-... GPT_IMAGE_MODEL_NAME=gpt-image-2 GPT_IMAGE_QUALITY=high # low / medium / high / auto ` 模板克隆模式需另配 vision 服务(不内置): `bash VISION_BASE_URL=https://your-openai-compatible-relay.example.com/v1 VISION_API_KEY=sk-... VISION_MODEL_NAME=gemini-3.1-pro-preview `

安全:脚本仅从 /.env、Claude skills 目录或显式 GPT_IMAGE2_PPT_ENV 读取凭据,不会向上递归项目 .env

生成流程(内置风格)

  • 用户给大纲 / slides_plan.json
  • Claude 生成或校准 slides_plan.json
  • 选风格,如 styles/editorial-mono.md
  • 运行:
`bash python3 generate_ppt.py --plan slides_plan.json --style styles/editorial-mono.md `
  • 产物在 outputs//
- images/slide-XX.png(16:9,1536×1024) - index.html(键盘翻页、全屏播放) - prompts.json(每页完整 prompt) -
数据来源ClawHub ↗ · 中文优化:龙虾技能库