导航菜单

OpenAI Sora问世GPT4可能也要被干掉了 有哪些优势

导读 OpenAI推出 AI视频生成产品Sora,正式加入AI视频生成领域的竞争。 OpenAI的CEO山姆奥特曼在社交平台上发文表示,OpenAI已经准备好了所有...

OpenAI推出 AI视频生成产品Sora,正式加入AI视频生成领域的竞争。 OpenAI的CEO山姆奥特曼在社交平台上发文表示,OpenAI已经准备好了所有的关键资源,将会专注于进行AGI打造。Sora的功能之强大,很有可能将 ChatGPT-4干掉。

Sora作为OpenAI手推的文本转视频模型,可以根据文本指令或者是动态图像快速生成一段长达一分钟的视频。视频当中包括生动的角色表情、精细复杂的场景、以及极其复杂的运动镜头。同时还能够接受现有视频的扩展,或者是将缺失的针填补。

在长度方面,每条提示60秒的视频与3秒的Pika Labs、4秒的Meta Emu Video、和18秒的Gen-2的相比稳赢。从官方所发布的演示视频来看,无论是在细节表现能力方面还是流畅度方面,Sora给人带来的效果都相当惊艳。

对于Sora,OpenAI仍然延续了以往的传统,并没有提供详细的技术方面的说明,但是其中的一些只言片语,就足以让消费者浮想联翩,其中最吸引大家注意的是对数据方面的处理。

Sora属于一个扩散型的模型,所采用的架构类似于GPT的Transformer。但是,

Openai表示在解决训练中视频数据与文本资料之间的统一方面,他们在处理视

频和图像数据时,将其分割成了最小的单元,并将其称之为小块,所对应的是

LLM中最基本的tokens单元。

这个技术细节非常的重要。在模型处理当中,将其作为基本的单元,深度学习

算法可以更有效的处理各种不同的视觉数据,包括了不同的宽高比分辨率和持续时间。最终给得出的效果相当的震撼,因此可以得出的结论是可以将对语言的理解能力迁移到对更多形态数据的理解方法正确。

Sora能够模拟和理解现实世界的模型的基础,这一功能将会在AGI的实现过程当中拥有着里程碑式的作用。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: