可灵2.6模型推出“音画同出”能力中文语音生成效果全球领先

作者：智通财经黄晓冬 2025-12-04 09:04:55

12月3日，可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。

智通财经APP获悉，12月3日，可灵推出视频生成2.6模型，该模型提供了里程碑式的“音画同出”能力，彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，能够在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，重构了AI视频创作工作流，极大提升创作效率。本次模型升级了文生音画、图生音画两大功能。目前，语音支持生成中文与英文，生成的视频长度最长可达10秒。

通过对物理世界声音与动态画面的深度语义对齐，可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼，同时在中文语音生成效果上保持全球领先。

智通声明：本内容为作者独立观点，不代表智通财经立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。更多最新最全港美股资讯，请点击下载智通财经App

可灵2.6模型推出“音画同出”能力 中文语音生成效果全球领先

可灵2.6模型推出“音画同出”能力中文语音生成效果全球领先