12月1日,可灵AI宣布全球首个统一多模态视频模型——可灵视频O1模型正式全量上线。这一模型通过构建全新的生成式底座,实现了功能的整合,引入了MVL(多模态视觉语言)交互架构,能够在单一输入框内无缝融合多种任务。结合Chain-of-thought技术,O1模型展现出强大的常识推理与事件推演能力,官方表示,其深层语义理解力使得每一张照片、每一个视频、每一段文字都能被视为指令。
同时,可灵AI推出了全新的创作界面,用户可以通过简单的对话轻松使用各种素材,精准生成每一处细节。O1模型支持多视角构建主体,确保无论镜头如何流转,主体特征都能稳定如一,保证画面的精准和连贯性。此外,该模型还支持自由组合多个主体,为用户提供了更多的创作自由度。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。