市场一电报道

OpenAI发布首个视频生成模型Sora 马斯克：人类输了

MANU 2024-02-18 10:24

日前，美国人工智能研究公司OpenAI发布了首个视频生成模型“Sora” ，该模型可以根据文本内容生成长约1分钟的视频，这也是人工智能领域一项重要的突破。

OpenAI在官网上详细介绍了Sora的功能和特点，称其能够生成包含多个角色、特定类型运动以及精确主题和背景细节的复杂场景。该模型不仅能够理解用户在文本提示中所要求的内容，更能将这些事物与现实世界中的存在方式相结合，呈现出逼真的视频效果。

此外，Sora还可以根据静态图片生成动画，并且对现有视频进行扩展，延伸画面的同时保持视觉风格的一致性。

作为展示，OpenAI发布了由Sora生成的视频，比如一名女足漫步在东京街头。在这则片段中，无论是主人公还是她身后的背景人群，动作都非常自然流畅。人物面部的细节刻画，也很细腻逼真，基本没有什么违和、突兀的感觉。

不过，OpenAI也坦承目前Sora也存在一定的弱点，它可能难以准确模拟复杂场景中的物理现象，也可能无法理解具体的因果关系。例如，一个人可能会咬一口饼干，但咬过之后，饼干上可能就没有咬痕了。

不管怎样，Sora的问世震撼了整个科技圈。一时间“Sora会砸掉谁的饭碗？”成为热议的话题，短视频和影视行业自然首当其冲。

一众大佬也是先后发声。马斯克就发文写道“gg humans”，意思是人类认输了，心服口服。Sora官号则互动道：现在开始由我们来接管。

还有网友将Sora和特斯拉FSD联系中一起，称二者之间有很多关联，马斯克也回应：“特斯拉用精确物理原理生成真实世界视频大约有一年了。这还不算什么超有趣的事情，因为所有的训练数据都来自汽车，所以它看起来就像特斯拉的视频，尽管它也是动态生成的（而不是记忆的）世界。我们的 FSD 训练计算能力不足，所以还没有使用其他视频进行训练，但当然可以。今年晚些时候，当我们有空余能力时，就会进行训练。”

360创始人周鸿祎也发文《Sora意味着实现通用人工智能可能从10年缩短至1年》。