gpt image 2 generation — GPT 图像 2 代生成

v1.0.0

使用WellAPI的gpt-image-2模型，从文本提示生成图像。每当用户要求创建、绘制、渲染或生成图像时，请使用此技能...

0· 0·0 当前·0 累计

by @laolujava (LuTong)

数据与API

使用场景：使用gpt image 2 generation — GPT 图像 2 代生成进行数据与API使用gpt image 2 generation — GPT 图像 2 代生成

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install gpt-image-2-generation

镜像加速npx clawhub@latest install gpt-image-2-generation --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

gpt image 2 generation — GPT 图像 2 代生成安装说明：安装命令：["openclaw skills install gpt-image-2-generation"]

需要定制？告诉我你的需求 →

技能文档

gpt-image-2 生成使用 gpt-image-2 模型从自然语言提示生成图像，该模型托管在 WellAPI。该技能调用 POST https://wellapi.ai/v1/images/generations，解码返回的 b64_json，并将图像写入磁盘。何时使用当用户要求以下内容时触发此技能： “生成日落海景图像” “画一只戴着高帽子的猫” “创建 1024x1024 像素的图像...” “制作...的插图/海报/艺术作品” 任何其他从文本描述生成视觉内容的请求。如果用户要求图像编辑（内涂画、变体等），此技能目前仅支持文本到图像生成；告知用户。先决条件 API 密钥 - 用户必须提供 WellAPI 密钥。如果环境变量 WELLAPI_API_KEY 已设置，则使用该值。否则，技能将查找本地配置文件： Linux/macOS：~/.config/gpt-image-2-generation/config.json Windows：%USERPROFILE%\.config\gpt-image-2-generation\config.json 如果两者都不存在，技能将提示用户注册并输入密钥（见下面的首次运行入门）。 Python 3.7+，仅使用标准库（无需第三方包）。首次运行入门（未找到 API 密钥）当找不到密钥时，在进行任何 API 调用之前，向用户逐字提示（如果适用，翻译为用户的语言）：使用本技能需要一个免费的 WellAPI API 密钥。请前往 https://wellapi.ai/register?aff=DTDH 注册账号并领取免费 API 密钥，然后把它粘贴到下方。然后调用帮助脚本以安全存储密钥： python3 scripts/setup_api_key.py 脚本将提示用户在标准输入中输入密钥，并将其持久存储在每个用户的配置文件中，权限为 0600。捕获密钥后永远不要回显或记录完整的密钥。如何生成图像使用捆绑的脚本 scripts/generate_image.py。它接受 CLI 参数，构建请求，发送请求，解码 base64 图像，并写入文件。必需参数标志含义 --prompt 要生成的图像的文本描述可选参数（默认值与 WellAPI 示例匹配）标志默认值允许值 --n 1 整数，图像数量 --size 1024x1024 例如 512x512、1024x1024、1024x1536、1536x1024 --quality 低低、中、高 --format jpeg jpeg、png、webp --model gpt-image-2 模型名称 --output ./gpt-image-2_<时间戳>.<格式> 输出文件路径。当 --n > 1 时，添加索引后缀。 --api-key （自动）覆盖环境变量/配置文件示例调用 # 最小 python3 scripts/generate_image.py --prompt "大海" # 自定义大小 + 格式 + 输出路径 python3 scripts/generate_image.py \ --prompt "A futuristic city skyline at dusk, cyberpunk style" \ --size 1024x1024 \ --quality high \ --format png \ --output ./city.png 脚本在成功时打印保存的图像的绝对路径，并在失败时退出非零值。请求/响应合同发送到 https://wellapi.ai/v1/images/generations 的请求正文： { "model": "gpt-image-2", "prompt": "大海", "n": 1, "size": "1024x1024", "quality": "低", "format": "jpeg" } 头部 Authorization: Bearer Content-Type: application/json 响应（图像在 data[i].b64_json 中）： { "created": 1778236581, "data": [{ "b64_json": "iVBORw0KGg..." }], "output_format": "png", "quality": "低", "size": "1024x1024", "usage": { "input_tokens": 8, "output_tokens": 196, "total_tokens": 204 } } 该技能对每个 b64_json 条目进行 base64 解码，并使用 output_format（或请求的 --format）作为文件扩展名将字节写入磁盘。代理工作流解析用户的图像请求 → 提取提示和任何显式大小、质量、格式、n。解析 API 密钥（环境变量 → 配置文件 → 通过 scripts/setup_api_key.py 提示用户）。使用解析的参数运行 scripts/generate_image.py。将保存的文件路径报告给用户。如果在可以渲染图像的环境中运行，还要显示结果。在 HTTP 错误时，逐字显示上游错误消息，并建议检查 API 密钥、配额或提示内容。此技能中的文件 SKILL.md — 此文件（元数据 + 指令） scripts/generate_image.py — 执行生成 scripts/setup_api_key.py — 交互式帮助存储 API 密钥 scripts/api_key.py — 共享帮助定位/加载密钥 README.md — 市场列表 LICENSE — MIT 许可证安全说明 API 密钥存储在用户的主目录中，权限为 0600，并且永远不会提交、记录或回显。所有网络流量仅发送到 https://wellapi.ai。该技能不执行或评估 API 返回的任何数据，仅对图像字节进行 base64 解码。

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐