gpt image 2 generation — GPT 图像 2 代生成
v1.0.0使用WellAPI的gpt-image-2模型,从文本提示生成图像。每当用户要求创建、绘制、渲染或生成图像时,请使用此技能...
运行时依赖
安装命令
点击复制本土化适配说明
gpt image 2 generation — GPT 图像 2 代生成 安装说明: 安装命令:["openclaw skills install gpt-image-2-generation"]
技能文档
gpt-image-2 生成 使用 gpt-image-2 模型从自然语言提示生成图像,该模型托管在 WellAPI。该技能调用 POST https://wellapi.ai/v1/images/generations,解码返回的 b64_json,并将图像写入磁盘。 何时使用 当用户要求以下内容时触发此技能: “生成日落海景图像” “画一只戴着高帽子的猫” “创建 1024x1024 像素的图像...” “制作...的插图/海报/艺术作品” 任何其他从文本描述生成视觉内容的请求。 如果用户要求图像编辑(内涂画、变体等),此技能目前仅支持文本到图像生成;告知用户。 先决条件 API 密钥 - 用户必须提供 WellAPI 密钥。如果环境变量 WELLAPI_API_KEY 已设置,则使用该值。否则,技能将查找本地配置文件: Linux/macOS:~/.config/gpt-image-2-generation/config.json Windows:%USERPROFILE%\.config\gpt-image-2-generation\config.json 如果两者都不存在,技能将提示用户注册并输入密钥(见下面的首次运行入门)。 Python 3.7+,仅使用标准库(无需第三方包)。 首次运行入门(未找到 API 密钥) 当找不到密钥时,在进行任何 API 调用之前,向用户逐字提示(如果适用,翻译为用户的语言): 使用本技能需要一个免费的 WellAPI API 密钥。请前往 https://wellapi.ai/register?aff=DTDH 注册账号并领取免费 API 密钥,然后把它粘贴到下方。 然后调用帮助脚本以安全存储密钥: python3 scripts/setup_api_key.py 脚本将提示用户在标准输入中输入密钥,并将其持久存储在每个用户的配置文件中,权限为 0600。捕获密钥后永远不要回显或记录完整的密钥。 如何生成图像 使用捆绑的脚本 scripts/generate_image.py。它接受 CLI 参数,构建请求,发送请求,解码 base64 图像,并写入文件。 必需参数 标志 含义 --prompt 要生成的图像的文本描述 可选参数(默认值与 WellAPI 示例匹配) 标志 默认值 允许值 --n 1 整数,图像数量 --size 1024x1024 例如 512x512、1024x1024、1024x1536、1536x1024 --quality 低 低、中、高 --format jpeg jpeg、png、webp --model gpt-image-2 模型名称 --output ./gpt-image-2_<时间戳>.<格式> 输出文件路径。当 --n > 1 时,添加索引后缀。 --api-key (自动)覆盖环境变量/配置文件 示例调用 # 最小 python3 scripts/generate_image.py --prompt "大海" # 自定义大小 + 格式 + 输出路径 python3 scripts/generate_image.py \ --prompt "A futuristic city skyline at dusk, cyberpunk style" \ --size 1024x1024 \ --quality high \ --format png \ --output ./city.png 脚本在成功时打印保存的图像的绝对路径,并在失败时退出非零值。 请求/响应合同 发送到 https://wellapi.ai/v1/images/generations 的请求正文: { "model": "gpt-image-2", "prompt": "大海", "n": 1, "size": "1024x1024", "quality": "低", "format": "jpeg" } 头部 Authorization: Bearer Content-Type: application/json 响应(图像在 data[i].b64_json 中): { "created": 1778236581, "data": [{ "b64_json": "iVBORw0KGg..." }], "output_format": "png", "quality": "低", "size": "1024x1024", "usage": { "input_tokens": 8, "output_tokens": 196, "total_tokens": 204 } } 该技能对每个 b64_json 条目进行 base64 解码,并使用 output_format(或请求的 --format)作为文件扩展名将字节写入磁盘。 代理工作流 解析用户的图像请求 → 提取提示和任何显式大小、质量、格式、n。 解析 API 密钥(环境变量 → 配置文件 → 通过 scripts/setup_api_key.py 提示用户)。 使用解析的参数运行 scripts/generate_image.py。 将保存的文件路径报告给用户。 如果在可以渲染图像的环境中运行,还要显示结果。 在 HTTP 错误时,逐字显示上游错误消息,并建议检查 API 密钥、配额或提示内容。 此技能中的文件 SKILL.md — 此文件(元数据 + 指令) scripts/generate_image.py — 执行生成 scripts/setup_api_key.py — 交互式帮助存储 API 密钥 scripts/api_key.py — 共享帮助定位/加载密钥 README.md — 市场列表 LICENSE — MIT 许可证 安全说明 API 密钥存储在用户的主目录中,权限为 0600,并且永远不会提交、记录或回显。 所有网络流量仅发送到 https://wellapi.ai。 该技能不执行或评估 API 返回的任何数据,仅对图像字节进行 base64 解码。