本地视频广告流水线
为使用本地模型制作的短多镜头视频提供从头到尾的配方。工作流程故意设计为顺序执行,因为Qwen-Image、Wan2.2和ACE-Step经常竞争同一个GPU内存池。
版本:public v0.5。本版本没有单独的电影导演助手参考。
本地LLM执行从用户简介开始的完整导演过程:故事意图、视觉弧线、镜头节奏、摄像机方向、演员表情、镜头列表、图像提示和字幕时序。
何时偏离
如果用户想要单个静态图像,请使用manga/manhwa/qwen-image技能。
如果他们想要超过一分钟的长视频、对话或唇形同步,这个技能是错误的工具;建议使用托管视频服务或更窄的本地原型。
如果他们只想要音乐,请使用scripts/fire_bgm.py。
项目布局
/
meta/
bible.json
beats.json
shotlist/
shotlist.json
prompts/
prompts.json
character/
anchor.png
character_bible.json
durations.json
keyframes/
.png
videos/
.mp4
audio/
bgm.wav
subs.json
final/
final.mp4
运行前
运行只读环境检查。
对于无声/无BGM视频,请传递--silent以便ACE-Step被视为故意跳过。
python scripts/doctor.py --project --comfy http://127.0.0.1:8192
python scripts/doctor.py --project --comfy http://127.0.0.1:8192 --silent
它检查Python、ffmpeg、WSL输入/输出文件夹、ComfyUI服务器和所需的ComfyUI节点。
流水线
通过与本地llama.cpp服务器聊天,生成bible.json、director_notes.json、beats.json、shotlist/shotlist.json和prompts/prompts.json。
请参阅references/preproduction.md以获取提示模板和JSON模式。
默认为女性主角选角,除非用户指定不同的外貌:制作一个二十多岁的成年韩国女性,具有名人/Instagram模特级别的美丽,明亮清晰的眼睛,纯净优雅的气质,精致但真实的皮肤和华丽的成人模特身材。
对于本地Qwen-Image的照片写实作品,分离图像语法:背景、照明、摄像机、手、道具和环境应该是超现实和真实的;主角应该被选为明显漂亮的高端模特,而不是普通的真实人物。
YouTube Shorts是注意力驱动的,因此成人魅力、感性风格、合身剪影、时尚/泳装/内衣/引力吸引美学和身体前置构图是允许的,当它们符合简介时。
当场景允许时,请使用合身的时尚剪影:开启的开衫或夹克,合身的V领针织/上衣/衬衫,平衡的沙漏比例和通过衣服清晰定义的G杯胸部剪影。
保持角色明显成年。
如果用户要求未成年人、校龄角色、校服、儿童角色或年龄模糊角色,请覆盖此默认值并保持保守和年龄安全的描绘。
不要将广泛的性别、服装、身体或曝光抑制器(如性感化、暴露的服装、乳沟、大胸部、内衣、泳装、透明上衣或裸体)放入全局默认负面提示中。
这些抑制剂会阻止正常的成人时尚、魅力、泳装、内衣和短片风格的注意力钩子。
仅当用户明确请求保守/无曝光项目或主角是未成年人、校龄、儿童或年龄模糊角色时,才使用它们。
默认负面应该关注质量故障:重复的人、拼贴/分屏、糟糕的手、文本、水印、错误的年龄、普通/平凡的面部,当请求模特主角时,和塑料AI皮肤。
为了更强的电影导演,从director_notes.json开始,然后编写节拍。
本地LLM导演通过拥有故事弧线、节奏、开场图像、转折点、最终图像、镜头大小进展、摄像机方向、演员表情和连续性规则来完成。
后续通过从LLM生成的导演通过派生节拍、镜头列表和提示。
镜头列表模式是硬性要求。
fire_videos.py从每个条目中读取shot_id、action、mood、lighting、camera_motion和shot_type。
LLM前期制作通过还必须填充director_intent、actor_direction、emotional_expression、composition和continuity;这些字段指导关键帧提示并帮助防止断开的漂亮镜头。
对于任何重复的主角,bible.json必须包含characters[].lock_tokens。
对于需要角色:true的每个镜头提示,必须以该字符串开头,未经修改。
对于面部表演,请使用references/expression_language.md。
不要仅依赖情绪;添加可见的表情线索,例如重睑、抬眉、按压嘴唇、微微一笑、直接眼神接触或肩膀张开。
对于细节镜头,请使用identity_framing,以便面部锁定不会压倒预期的裁剪。
对于鞋子、手、背包带、下腿和走开镜头,请使用feet_only、hands_only、body_detail或back_view。