运行时依赖
安装命令
点击复制技能文档
电商套图生成助手概览 本Skill实现从「商品原始图片 + 卖点信息」到「完整电商套图」的一键生成流程: ① 上传商品图片(必须)+ 输入卖点信息(可选) ↓ ② AI视觉分析:提取商品主体,智能生成卖点文案(可编辑) ↓ ③ 选择平台规范 + 套图类型(7种标准图) ↓ ④ AI生成每张图的详细Prompt(可编辑) ↓ ⑤ 调用图像生成API,输出完整套图
第一步:收集输入信息 必须项 商品图片:用户上传的原始商品图(平铺图/白底图/实物图均可) 可选项(若用户未提供,AI将自动从图片中分析生成) 字段 说明 商品名称 如"卡通小狗印花宽松精梳棉短袖T恤" 核心卖点 材质、版型、设计特点等 3-5 条 适用人群 如"追求舒适简约风的青少年" 期望场景 如"校园日常、居家休闲、户外出游" 规格参数 材质、颜色、版型、领型、袖长等
第二步:AI分析与卖点生成 视觉分析步骤 识别商品类型、颜色、款式、设计元素 提取商品主体轮廓与关键视觉特征 基于视觉特征推断材质、功能卖点 生成结构化卖点(JSON格式,供后续图片生成使用) 卖点JSON结构 { "product_name": "商品名称", "product_type": "服装/3C/家居/其他", "visual_features": ["白色", "圆领", "短袖", "卡通小狗印花"], "selling_points": [ {"icon": "fabric", "en": "Combed Cotton", "zh": "精梳棉面料"}, {"icon": "fit", "en": "Loose & Breathable", "zh": "宽松透气"}, {"icon": "design", "en": "Cute Design", "zh": "萌趣设计"} ], "target_audience": "青少年、学生群体", "usage_scenes": ["校园", "居家", "户外"], "color": "白色", "material": "精梳棉" }
第三步:选择平台与套图配置 平台选择 平台类型 平台 推荐尺寸 语言 国内 淘宝/天猫 800×800 (1:1) 中文 国内 京东 800×800 (1:1) 中文 国内 拼多多 750×750 (1:1) 中文 国内 抖音/小红书 1080×1350 (4:5) 或 1:1 中文 国际 Amazon 2000×2000 (1:1) 英文 国际 独立站/Shopify 2000×2000 (1:1) 或 16:9 英文 标准套图(7种) 每种图的详细规格见references/image-types.md # 图片类型 核心目标 推荐位置 1 白底主图 商品全貌展示,符合平台收录规则 第1张主图 2 核心卖点图 3大卖点图标化呈现 第2张 3 卖点图 单一核心卖点深度展示 第3张 4 材质图 面料/工艺特写,建立品质信任 第4张 5 场景展示图 生活方式场景,激发代入感 第5张 6 模特展示图 真人/AI模特穿搭,直观展示效果 第6张 7 多场景拼图 多场景适用性对比,提升决策 第7张
第四步:生成图片Prompt 各图类型的Prompt模板见references/image-types.md Prompt构建原则 商品一致性:所有图片必须保持商品颜色、结构、比例、细节不变 背景差异化:每张图背景/场景各不相同,形成完整故事线 文字分离:图片本身不含文字,文案通过后处理叠加(除非使用图像生成API支持文字) 品质标准:photorealistic, high quality, studio lighting, 8K, commercial photography Prompt结构模板 [商品描述] + [版型/颜色/印花精确描述] + [场景/背景描述] + [光线/氛围] + [拍摄角度] + [品质词]
第五步:多供应商图像生成 各供应商API接入详情见references/providers.md 支持的图像生成供应商(5个) 供应商 默认模型 模型环境变量 国内可用 特点 OpenAI dall-e-3 OPENAI_MODEL 需代理 高质量写实,细节清晰 Google gemini-3.1-flash-image-preview GEMINI_MODEL 需代理 原生图像生成,2K输出 Stability AI core STABILITY_MODEL 需代理 精准控制构图 阿里云 qwen-image-2.0-pro DASHSCOPE_MODEL 直连 同步接口,中文优化 字节跳动 doubao-seedream-5-0-260128 ARK_MODEL 直连 中文理解好,风格多样 模型名可通过--model参数、环境变量或默认值配置,优先级:--model > 环境变量 > 默认值。 供应商检测 python3 scripts/check_providers.py 输出JSON包含configured数组,显示哪些供应商已配置API Key。 执行生图脚本 python3 scripts/generate.py \ --product '{"product_description_for_prompt": "...", "selling_points": [...]}' \ --provider tongyi \ --types white_bg,key_features,selling_pt,material,lifestyle,model,multi_scene \ --output-dir ./output/raw/ generate.py完整参数 参数 说明 默认值 --product 必填,商品JSON字符串 — --provider 必填,供应商:openai / gemini / stability / tongyi / doubao — --api-key API Key,也可通过环境变量传入 环境变量 --base-url 自定义代理地址,也可通过_BASE_URL环境变量传入 官方地址 --model 模型名称,也可通过_MODEL环境变量传入 见供应商表 --types 逗号分隔的套图类型 全部7种 --output-dir 输出目录 ./output/raw/ 代理API使用示例 各供应商均支持通过--base-url或环境变量指定代理地址: # Gemini通过代理(代理使用Bearer token鉴权) GEMINI_API_KEY="sk-proxy-key" \ GEMINI_BASE_URL="https://my-proxy.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \ python3 scripts/generate.py --provider gemini --product '...' # 通义通过代理 DASHSCOPE_API_KEY="sk-..." \ DASHSCOPE_BASE_URL="https://my-proxy.com/api/v1/services/aigc/multimodal-generation/generation" \ python3 scripts/generate.py --provider tongyi --product '...' # 切换模型版本 DASHSCOPE_MODEL="qwen-image-2.0" \ python3 scripts/generate.py --provider tongyi --product '...'
第六步:文案叠加 使用Pillow将文案叠加到生成图片上: python3 scripts/overlay.py \ --input-dir ./output/raw/ \ --product '{"selling_points": [...], "product_name_zh": "..."}' \ --lang zh \ --output-dir ./output/final/ 叠加规范(各图类型) 白底主图 / 模特展示图:无文案叠加 核心卖点图:右侧区域,WHY CHOOSE US + 3个卖点标签,深色文字 卖点图:左上主标题 + 左下两条副标题,深色文字 材质图:右上主标题 + 右侧两条副标题,深色文字 场景展示图:左上主标题 + 左下两条副标题,白色文字+阴影 多场景拼图:顶部居中主标题 + 底部两侧场景标注,白色文字+阴影 各图类型叠加坐标规范见references/providers.md(Canvas规范部分)
CLI执行流程(Agent调用) Agent或CLI环境下的完整流程: # Step 1: 检测供应商配置 python3 scripts/check_providers.py # Step 2: Agent分析商品图片(Claude Vision),输出product JSON # Step 3: 执行生图 python3 scripts/generate.py \ --product '{"product_description_for_prompt": "...", "selling_points": [...]}' \ --provider tongyi \ --output-dir ./output/raw/ # Step 4: 文案叠加 python3 scripts/overlay.py \ --input-dir ./output/raw/ \