刷屏科技圈的“视频生成”到底有多颠覆前景如何

导读 2024年2月16日凌晨作为科技巨头的OpenAI公司在其官网上发布了第1个纹身视频大模型Sora，据OpenAI公司介绍这个模型，可以根据图片、视频、文...

2024年2月16日凌晨作为科技巨头的OpenAI公司在其官网上发布了第1个纹身视频大模型Sora，据OpenAI公司介绍这个模型，可以根据图片、视频、文字等不同的提示词，生成最长可以达到一分钟的高清视频。

OpenAI官网上上传了几十个演示视频，从演示视频可以看到该模型生成的视频中，有多个富有情感的角色，镜头是通过多维度拍摄，叠加运镜的画面非常有质感，丝毫看不出来是AI模型生成，比如在演示视频中就有一个可以和好莱坞大片相媲美的电影预告片。让人看了直呼视频行业很可能会受到冲击，将会有部分的人失业。

其实在AI领域中文本自动生成视频并不罕见，但Sora模型之所以会成为开年王炸，是因为以下几点：

1.Sora模型在生成视频的时候，时长最高可以长达一分钟，相比之下其他文生视频的模型，生成时间只有十几秒或者短短的几秒。Sora模型生成的视频非常的连贯，一分钟视频会通过不同的镜头展现，视频在呈现的时候不管是还原度，还是高精度都可圈可点。

2.Sora模型拥有超强的理解文本能力，不光完美的继承了DALL·E 3画质，还继承了遵循指令的能力，能够根据不同的文本指令，生成一个拥有非常多细节的视频，在以往的AI视频生成模型中，只能死板的照本宣科制作视频，但是Sora模型已经做到了可以理解不同文案，还会根据文案的基础自己在对视频进行扩展。

3.Sora出现之前以往的AI生成视频模型，都是通过文本生成视频，但是Sora能够接受不同类型的输入提示。另外还能根据视频中的时间维度，做到向前延伸或者向后延伸。