🎬 首款音画同步 AI 模型

LTX-2 视频生成器:重新定义 AI 视频生产力

告别无声 AI 视频。LTX-2 是全球首个在单一统一模型中实现视觉与音频完全同步生成的生产级模型,支持高达 20 秒的 4K 50 FPS 电影级内容输出。

🎁 GitHub 和 Hugging Face 开源权重已发布

立即体验视频生成

在首页直接使用:文生视频 / 图生视频 / 视频到视频。

真正的音画同步生成

LTX-2 不再采用"先视频后配音"的零散流程,而是在单一过程中同步生成动作、对话、环境音和音乐。

精准唇形同步

实现精确的唇形同步 (Lip-sync),确保每个字都与角色口型完美匹配。

物理环境音效

生成物理对齐的环境音效 (Foley),让画面动作与声音完美契合。

专业级 4K 50 FPS

原生支持 4K 分辨率与 50 FPS 帧率,专为工作室、开发者和企业级生产工作流打造。

20 秒超长生成

支持生成最长 20 秒的高保真剪辑,突破了现有同类模型 (如 Sora 2 或 Veo 3) 的时长限制。

精确的创意控制

LTX-2 提供专业级控制工具,确保您的创意构想能够精确实现。

提供对推镜头 (Dolly in)、拉镜头 (Dolly out)、左移及静止镜头的精确指令,让您拥有导演级别的镜头控制能力。

为什么选择 LTX-2?

技术优势与性能突破,让 LTX-2 成为专业视频制作的理想选择。

极速推理

在 H100 GPU 上,LTX-2 的单步渲染速度比同类模型 (如 WAN 2.2 14B) 快约 18 倍。

19B 异步双流架构

采用 14B 视频流与 5B 音频流的异步设计,在保证视觉复杂度的同时兼顾音频效率。

深度语义理解

集成 Gemma 3 12B 作为文本编码器,并引入"思考令牌",大幅提升对复杂提示词的遵循能力。

开源与集成

模型权重完全开源 (GitHub/Hugging Face),并原生支持 ComfyUI 和 Fal 的集成。

快速与专业模式

Fast Flow 专为快速迭代设计,Pro Flow 专注高保真输出,针对不同生产需求优化。

视频编辑与重拍

具备 Retake (重拍) 和详细的视频修复工具,支持在不从头开始的情况下编辑视频元素。

常见问题

关于 LTX-2 视频生成器的常见问题。如需了解更多信息,请联系我们。







体验电影级 AI 视频生成

立即使用 LTX-2 开始创作专业音画同步视频。

LTX-2 视频生成器|音画同步 AI 视频生成