导航菜单

刷屏科技圈的“视频生成”到底有多颠覆 前景如何

导读 2024年2月16日凌晨作为科技巨头的OpenAI公司在其官网上发布了第1个纹身视频大模型Sora,据OpenAI公司介绍这个模型,可以根据图片、视频、文...

2024年2月16日凌晨作为科技巨头的OpenAI公司在其官网上发布了第1个纹身视频大模型Sora,据OpenAI公司介绍这个模型,可以根据图片、视频、文字等不同的提示词,生成最长可以达到一分钟的高清视频。

OpenAI官网上上传了几十个演示视频,从演示视频可以看到该模型生成的视频中,有多个富有情感的角色,镜头是通过多维度拍摄,叠加运镜的画面非常有质感,丝毫看不出来是AI模型生成,比如在演示视频中就有一个可以和好莱坞大片相媲美的电影预告片。让人看了直呼视频行业很可能会受到冲击,将会有部分的人失业。

其实在AI领域中文本自动生成视频并不罕见,但Sora模型之所以会成为开年王炸,是因为以下几点:

1.Sora模型在生成视频的时候,时长最高可以长达一分钟,相比之下其他文生视频的模型,生成时间只有十几秒或者短短的几秒。Sora模型生成的视频非常的连贯,一分钟视频会通过不同的镜头展现,视频在呈现的时候不管是还原度,还是高精度都可圈可点。

2.Sora模型拥有超强的理解文本能力,不光完美的继承了DALL·E 3画质,还继承了遵循指令的能力,能够根据不同的文本指令,生成一个拥有非常多细节的视频,在以往的AI视频生成模型中,只能死板的照本宣科制作视频,但是Sora模型已经做到了可以理解不同文案,还会根据文案的基础自己在对视频进行扩展。

3.Sora出现之前以往的AI生成视频模型,都是通过文本生成视频,但是Sora能够接受不同类型的输入提示。另外还能根据视频中的时间维度,做到向前延伸或者向后延伸。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: