运行时依赖
安装命令
点击复制技能文档
视频生成技能 此技能使用Doubao Seedance 1.0/1.5模型生成视频。 触发条件 用户想要从文本描述生成视频 用户想要基于图像(第一帧/最后一帧)创建视频 用户想要使用参考材料(图像、视频、音频)创建视频 用户询问视频生成能力 使用环境变量 在使用此技能之前,请确保设置以下环境变量: ARK_API_KEY 或 MODEL_VIDEO_API_KEY 或 MODEL_AGENT_API_KEY:视频生成服务的API密钥 MODEL_VIDEO_API_BASE:API基URL(可选,具有默认值) MODEL_VIDEO_NAME:模型名称(可选,具有默认值) 函数签名 async def video_generate( params:list, batch_size:int = 10, max_wait_seconds:int = 1200, model_name:str = None, )-> Dict: 参数 params(list[dict]):视频生成请求列表。每个项都是一个字典,包含以下字段: 每项必需: video_name(str):输出视频文件的名称/标识符 prompt(str):描述要生成的视频的文本。支持中文和英文。 每项可选 - 输入材料: first_frame(str):第一帧图像的URL last_frame(str):最后一帧图像的URL reference_images(list[str]):1-4个参考图像URL,用于风格/内容指导 reference_videos(list[str]):0-3个参考视频URL(mp4/mov,2-15秒每个,总计≤15秒) reference_audios(list[str]):0-3个参考音频URL(mp3/wav,2-15秒每个,总计≤15秒) 每项可选 - 视频输出参数: ratio(str):宽高比。选项:“16:9”(默认)、“9:16”、“4:3”、“3:4”、“1:1”、“2:1”、“21:9”、“adaptive” duration(int):视频长度(秒)。范围:2-12秒,取决于模型 resolution(str):视频分辨率。选项:“480p”、“720p”、“1080p” frames(int):总帧数。必须在[29, 289]范围内,并遵循25 + 4n格式 camera_fixed(bool):锁定相机运动。默认:false seed(int):可复现性随机种子。范围:[-1, 2^32-1] watermark(bool):是否添加水印。默认:false generate_audio(bool):是否生成音频。仅Seedance 1.5支持此功能 tools(list[dict]):工具配置,例如[{"type": "web_search"}] 输入模式 文本到视频:仅提供prompt,无图像/视频 第一帧指导:提供first_frame作为起始图像 第一帧+最后一帧指导:提供first_frame和last_frame作为过渡视频 参考图像:提供reference_images作为风格/内容指导 多模态参考:结合reference_images、reference_videos、reference_audios 返回值 脚本返回信息 video_generate.py脚本将返回以下信息: { "status": "success" | "partial_success" | "error", "success_list": [{"video_name": "video_url"}], "error_list": ["video_name"], "error_details": [{"video_name": "...", "error": {...}}], "pending_list": [{"video_name": "...", "task_id": "cgt-xxx", ...}] } 基于脚本返回信息,返回给用户的最终响应包括视频生成任务的描述和视频URL(s)。您可以下载视频,但视频URL应提供给用户用于查看和下载。 注意:URL是脚本返回信息中的success_list中的'url'。 必须返回两种类型的信息:文件格式,返回文件(如果您有其他方法发送视频文件)和本地路径,例如:/root/.openclaw/workspace/skills/video-generate/xxx.mp4 生成后,呈现视频URL列表以Markdown格式,例如: