运行时依赖
安装命令
点击复制技能文档
🫧 Kling 3.0 — Pro Pack 在 RunComfy runcomfy.com · docs · GitHub Kling 3.0 是快手科技的第三代电影级视频模型。本技能涵盖了 RunComfy 上的所有六个 Kling 3.0 渲染端点:三个质量等级(标准、专业、4K)跨两个模式(文本到视频和图像到视频)。
什么是 Kling 3.0 Kling 3.0 是 Kling 视频模型的 V3 代。它生成具有同步原生音频、跨镜头一致的角色身份和物理感知运动的多镜头电影级视频。与 Kling 2.x 相比,Kling 3.0 支持更长的视频片段(最长 15 秒)、4K 质量等级的原生 4K 输出和统一的多提示段系统,允许一个 Kling 3.0 生成包含多个不同的场景和受控过渡。
Kling 3.0 在 RunComfy 上以三个渲染等级提供,每个等级都有文本到视频或图像到视频模式: 标准 - 最便宜的等级,最高 1080p 输出。使用 Kling 3.0 标准进行快速迭代、预览、A/B 变体和社交短片。 专业 - 最高保真度的 1080p 输出。使用 Kling V3.0 专业版进行英雄级别的 1080p 片段,运动现实感和身份保留至关重要。 4K - 原生 3840x2160 输出。使用 Kling V3.0 4K 进行高分辨率品牌电影、巨幕电影序列和原生分辨率的完成版。
所有三个等级共享相同的 Kling 3.0 多镜头架构。等级之间的区别在于分辨率上限、运动保真度预算和价格。
6 个 Kling 3.0 端点 每个端点对应一个(等级,模式)对。所有六个端点共享相同的 Kling 3.0 基础模型。
端点 锚点 分辨率 率(无音频) 率(有音频) kling/kling-3.0/standard/text-to-video Kling 3.0 标准 t2v 最高 1080p $0.084/s $0.126/s kling/kling-3.0/standard/image-to-video Kling 3.0 标准 图像到视频 最高 1080p $0.084/s $0.126/s kling/kling-3.0/pro/text-to-video Kling V3.0 专业 文本到视频 1080p $0.112/s $0.168/s kling/kling-3.0/pro/image-to-video Kling V3.0 专业 图像到视频 1080p $0.112/s $0.168/s kling/kling-3.0/4k/text-to-video Kling V3.0 4K 文本到视频 3840x2160 $0.42/s 固定 $0.42/s 固定 kling/kling-3.0/4k/image-to-video Kling V3.0 4K 图像到视频 3840x2160 $0.42/s 固定 $0.42/s 固定
4K 等级的价格与音频无关。标准和专业等级启用音频时每秒费用增加约 50%。
何时选择哪个 Kling 3.0 等级 根据输出在管道中的角色选择 Kling 3.0 等级。 草稿、预览、社交短片、A/B 变体:Kling 3.0 标准。最便宜。质量适用于除英雄镜头以外的所有内容。 英雄 1080p 片段、广告创意、具有高运动保真度的对话头:Kling V3.0 专业。比标准版贵约 33%,但运动和身份保持更好。 4K 品牌电影、巨幕电影、完成版:Kling V3.0 4K。原生 3840x2160(无升级步骤)。固定 $0.42/s 使预算更可预测。仅当输出真正需要 4K 时使用 - 它的成本约为标准版的 5 倍。
根据是否有源图像选择模式: 文本到视频(t2v):仅提示,Kling 3.0 从头开始生成外观。使用 Kling 3.0 t2v 进行新场景、全新构图、无现有参考的环境。 图像到视频(i2v):提示 + 源图像,Kling 3.0 动画化图像。使用 Kling 3.0 i2v 当您有一个必须保留到输出的确切参考(面部、产品、场景)时。
如果用户明确要求 Kling 3.0、Kling V3.0、Kling 专业版或 Kling 4K,则无论如何都将路由到此技能。
先决条件 RunComfy CLI:npm i -g @runcomfy/cli RunComfy 账户:runcomfy login 打开浏览器设备代码流程。 CI/容器:设置 RUNCOMFY_TOKEN= 而不是 runcomfy login。 对于 i2v 端点:一个公开可获取的源图像 URL(HTTPS、JPEG/PNG/WebP)。
输入模式(所有 6 个 Kling 3.0 端点共享) 字段 类型 必需 默认 值 prompt 字符串 是 - 场景、运动、摄像机、氛围的文本描述。支持多段提示通过 prompt_segments 进行场景过渡。 image_url 字符串 是(i2v 仅) - Kling 3.0 i2v 的源图像。HTTPS URL。JPEG/PNG/WebP。 tail_image_url 字符串 否(i2v 仅) - Kling 3.0 i2v 的可选结束图像,用于控制开始到结束的帧过渡。 negative_prompt 字符串 否 - 要从 Kling 3.0 输出中排除的元素。 duration 整数 否 5 Kling 3.0 生成的秒数(3-15)。 aspect_ratio 枚举 否 16:9 16:9、9:16、1:1、4:3、3:4、21:9。 cfg_scale 浮点数 否 0.5 提示指导强度。更高 = 更严格地遵循提示。 generate_audio 布尔值 否 false 启用 Kling 3.0 内部同步音频。增加标准和专业等级的费用;4K 等级为固定费率。 seed 整数 否 - Kling 3.0 变体测试的可复现性。
如何调用每个 Kling 3.0 端点 Kling 3.0 标准文本到视频(最便宜的 1080p 草稿): runcomfy run kling/kling-3.0/standard/text-to-video \ --input '{ "prompt": "", "duration": 5, "aspect_ratio": "16:9" }' \