导航菜单

一场投资过亿的视频暴力美学Sora带来的影响

导读 2024年春节Sora模型的诞生,在AI领域中激起了千层浪花。根据OpenAI公司在官网中发布的演示视频,可以看到该模型已经能够做到理解文本,理解...

2024年春节Sora模型的诞生,在AI领域中激起了千层浪花。根据OpenAI公司在官网中发布的演示视频,可以看到该模型已经能够做到理解文本,理解物理世界的能力,并且会根据文本生成多个情感角色,并且在视频中这些情感角色会进行特定运动的一些复杂场景。

OpenAI公司在技术报告中宣称,Sora模型能够做到理解,并且模拟现实世界模型的基础,也相信Sora的这种能力能加速AGI发展,但是Sora模型诞生之后,也有人持不同的声音。

Meta首席科学家杨立昆认为,Sora只是根据关键句子来生成一些达到以假乱真的视频,并不代表Sora模型就已经理解了物理世界。

Sora为何能够根据视频内容,或者是通过一些关键文本,生成出长达60秒的高清视频,通过多个研究技术报告,以及访谈多位业内人士后发现,这种模型在研发时并没有采用太多惊人的技术,现如今视频模型技术在并不完善的情况之下。Sora能够拥有的出色效果,降低了其他该领域的参与者在技术方面的试错成本,也让其他参与者在视频生成的设计逻辑方面,提供了更多新的理念。

Sora的诞生解锁了很多人对于多模态视频模型的想象。Sora出现之前在视频领域中,大多数公司受制于数据集以及技术方面的难题,一直都没有能够研发出类似于ChatGP和Midjourney这些比较高级的现象级产品。

众所周知视频的生成能力,相较于文生图拥有的技术难题会更加的复杂,因此AI生成视频工具想要让它,生成一个比较流畅的视频,不光要掌握最基础的自然语言理解能力,还要让模型在风格方面的准确性,稳定性、画面的流畅度以及动作的连贯性方面,都有着非常好的表现。

Sora的成功也让人们见识到了,OpenAI公司对于暴力美学的研发胜利。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: