LTXV 提供无与伦比的速度,使用 20 个扩散步骤在短短 4 秒内生成一个 5 秒的视频(121 帧,分辨率为 768x512) 。其扩散变压器架构可确保平滑运动并消除对象变形等常见问题,从而提供卓越的运动一致性。
请尝试以下步骤,并记住您的提示需要很长且具有描述性:
- 更新至ComfyUI最新版本
- 下载ltx-video-2b-v0.9.safetensors到models/checkpoints文件夹中
- 确保t5xxl_fp16位于您的models/clip文件夹中
- 工作流提供了一些测试提示词
1.提示词反推:
https://huggingface.co/spaces/fancyfeast/joy-caption-alpha-two
2.把反推出来的词复制到大语言模型(豆包、gpt等)
3.修改提示词:
“把我给你的内容 改进 添加描述摄像机运动 和人物的动作
输出格式为:改进的提示词+翻译成中文的提示词
了解回复OK即可”
4.AI回复后 把joy2出来的词复制给他即可