Comfyui Client — Comfyui 客户端
v1.0.0此技能应在用户需要通过 ComfyUI 生成图片或视频时使用。支持加载工作流、修改 prompt、提交任务、轮询结果并自动下载生成的图片和视频。需 ComfyUI 服务已启动。 (无需翻译,原文已是中文)
运行时依赖
安装命令
点击复制技能文档
ComfyUI 工作流客户端 概述 本技能封装了 ComfyUI 工作流调用能力,用于通过 ComfyUI API 生成图片和视频。核心功能包括:加载工作流 JSON、修改 prompt 和图片节点、提交到 ComfyUI 队列、轮询任务状态、自动下载生成结果。
适用场景: 用户要求根据文本描述生成图片 用户要求根据参考图生成变体或编辑 用户要求生成图片转视频、图生视频 需要批量或自动化调用 ComfyUI 工作流
前置条件: ComfyUI 服务已启动(默认 http://127.0.0.1:8188) 工作流 JSON 文件可用 工作流所需模型已安装到 ComfyUI
触发条件 当满足以下条件时应使用此技能: 用户表达生成意图 要求"用 ComfyUI 生成图片"、"根据 prompt 画图" 要求"图生图"、"图片编辑"、"生成视频" 提供文本描述并希望得到 AI 生成的图像 技术上下文明确 用户提到 ComfyUI、工作流、txt2img、img2img 等 用户提供工作流文件路径或项目内已知工作流 服务可用 可先检查 ComfyUI 服务是否可访问 若不可用,应提示用户启动 ComfyUI
捆绑资源 脚本: scripts/comfyUIClient.js - ComfyUI 工作流调用主脚本 工作流: assets/workflows/ - 5 个常用工作流(Z-Image、Qwen 编辑、Wan 视频等)
执行方式: 技能内脚本:node .claude/skills/comfyui-client/scripts/comfyUIClient.js [选项] 项目脚本(等效):node scripts/comfyUIClient.js [选项]
路径解析: 技能内脚本会自动解析项目根目录,工作流路径和输出目录支持相对路径(相对于项目根)。
核心能力
- 文生图(txt2img)
- 指定 prompt 节点
- 图生图 / 图片编辑(img2img)
3a. Z-Image Turbo + ControlNet(结构引导重绘) 基于 Canny 边缘检测提取输入图片轮廓,用 ControlNet 引导模型生成新图。适合风格转换、基于轮廓的重绘。 输入:1 张图片 + 文本 prompt 速度:快(9 步,CFG=1) LoadImage 节点 ID:58 Prompt 节点:自动查找(子图内部 CLIPTextEncode 会被展开到顶层) # 使用 --image-path 自动上传本地图片(推荐) node .claude/skills/comfyui-client/scripts/comfyUIClient.js \ --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo_fun_union_controlnet.json \ --prompt "oil painting style, vibrant colors" \ --image-node 58 --image-path "path/to/input_photo.png" # 或使用已上传到 ComfyUI input/ 的图片 node .claude/skills/comfyui-client/scripts/comfyUIClient.js \ --workflow .claude/skills/comfyui-client/assets/workflows/image_z_image_turbo_fun_union_controlnet.json \ --prompt "oil painting style, vibrant colors" \ --image-node 58 --image-file "input_photo.png" 注意:该工作流使用子图(subgraph),脚本会自动展开子图内部节点。
3b. Qwen 图片编辑(语义级多图编辑) 基于 Qwen 视觉语言模型的智能编辑。支持自然语言编辑指令和最多 3 张参考图片。适合材质替换、风格迁移、多图参考编辑。 输入:1-3 张图片 + 自然语言编辑指令 速度:中等(20 步,CFG=4) LoadImage 节点 ID:主图 41,参考图2 83,参考图3 87(默认禁用) Prompt 节点 ID:正面 68,负面 69 可选 Lightning LoRA 加速到 4 步(节点 74,默认禁用) # 单图编辑 node .claude/skills/comfyui-client/scripts/comfyUIClient.js \ --workflow .claude/skills/comfyui-client/assets/workflows/image_qwen_image_edit_2511.json \ --prompt-node 68 --prompt "将背景改为海边夕阳" \ --image-node 41 --image-file "sofa.png" # 多图材质替换(图1 主图 + 图2 参考材质) node .claude/skills/comfyui-client/scripts/comfyUIClient.js \ --workflow .claude/skills/comfyui-client/assets/workflows/image_qwen_image_edit_2511.json \ --prompt-node 68 --prompt "Change the furniture leather in image 1 to the fur material in image 2." \ --image-node 41 --image-file "leather_sofa.png" \ --image-node2 83 --image-file2 "texture_fur.png" 注意:Qwen Edit 工作流的 prompt 节点不是 CLIPTextEncode,需使用 --prompt-node 68 明确指定。
3c. 两种图片编辑工作流如何选择 维度 | Qwen 图片编辑 | Z-Image Turbo + ControlNet 技术路线 | Qwen 视觉语言模型,语义理解 | Canny 边缘 + ControlNet 结构引导 输入 | 1–3 张图 + 自然语言指令 | 1 张图 + 文本 prompt 速度 | 较慢(约 20 步) | 快(9 步) 结构保持 | 依赖模型理解,可能变化 | 强约束,轮廓基本不变 Qwen 编辑适用场景: 材质替换(如「把图 1 的皮质换成图 2 的毛绒材质」) 多图参考编辑(主图 + 1–2 张参考图) 语义级修改(背景、颜色、风格等需理解图像内容的编辑) 自然语言编辑指令(支持「将背景改为海边夕阳」等描述) ControlNet 适用场景: 风格转换(保持轮廓,只改风格,如照片→油画、素描) 轮廓重绘(基于边缘线生成新图,构图基本不变) 线稿上色、结构保持的变体 追求速度、快速出图 快速选择: 需要理解图像内容做语义修改 → 选 Qwen 编辑 需要保持构图/轮廓做风格转换 → 选 ControlNet
- 视频生成
命令行选项 选项 | 说明 | 默认值 --workflow | 工作流 JSON 文件路径(必需) | - --server | ComfyUI 服务器地址 | http://127.0.0.1:8188 --client-id | 客户端 ID | 自动生成 --prompt-node | 要修改的 prompt 节点 ID | 自动查找 --prompt | 新的 prompt 文本 | - --negative-prompt-node | 负面