全球首创统一多模态视频大模型,可灵AI O1正式上线,实现一语生成视频
- 更新日期:2025-12-02
- 查看次数:6588
全球首个统一多模态视频大模型“可灵AI O1”正式上线,该模型可实现一键生成视频,具有高度灵活性和实用性,为视频制作带来革命性变革。通过该模型,用户可以轻松地通过一句话快速生成高质量的视频内容,为视频创作领域带来新的发展机遇。
电脑知识网12月2日消息,可灵AI正式全量上线其全新O1视频大模型,号称“全球首个统一多模态视频大模型”,打破传统视频生成工具功能割裂、操作复杂的痛点。
目前,该模型已在可灵App及官网开放体验。

与以往需分步处理文生视频、图生视频、局部编辑等任务不同,可灵O1基于创新MVL(多模态视觉语言)交互架构,在单一输入框内无缝融合文字、图像、视频等多种指令。
结合Chain-of-thought技术,模型不仅能理解用户意图,还能进行常识推理与事件推演,实现更符合逻辑的视频生成。

例如,用户上传一段真人视频后,只需简单对话指令,即可局部增加/删除元素、智能延展前后镜头、捕捉动作生成新画面。
更关键的是,O1通过多视角主体构建技术,彻底解决视频中人物或物体在镜头切换时“特征漂移”的行业难题,确保多主体场景下画面精准连贯。
此外,O1支持3–10秒自由生成时长,把叙事节奏的控制权交还创作者。
无论是短视频博主、广告团队还是个人用户,都能快速产出高质量、高一致性的创意视频。


