新V观海外:OpenAI Sora模型背后的架构创新 新V观海外:OpenAI Sora模型背后的架构创新
admin
2024-02-18 12:45:10
0


陈沛/文 OpenAI最近介绍了新的AI视频模型Sora的部分生成视频示例,引发了很多关注。Sora模型直观上带来的最大提升是能够直接生成长达60秒的视频,且在视频质感和流畅度方面表现的非常出色。

由于OpenAI的明星效应,Sora模型一经推出便引发很多用户竞相转发,表示视频效果惊为天人,视频制作的相关工作都会被取代。

Sora模型的实际生成效果仍是未知数

但从我实际使用和观察RunwayML、Stable Video Diffusion(SVD)、Adobe Firefly等主流AI视频服务的情况来看,目前AI生成视频的质感往往达不到最初宣传的效果,还会在物体行进方向、人物四肢等方面出现明显错误,无法满足实际应用的需求。

而Sora模型目前还处于测试阶段,预计再经过一段时间的安全测试和用户反馈后才会正式提供服务,因此还无法了解Sora模型的实际效果。

不过,OpenAI也没有刻意回避Sora模型生成错误内容的情况。在OpenAI发布的技术报告中有一段Sora模型生成的错误视频,展示了桌上的水杯会先从底部流出果汁,然后沿着错误的方向和角度倒在桌上。

Sora模型的背后是2022年刚刚面世的新架构

Sora模型的最大突破是视频时长。与之前的RunwayML、SVD只能生成4秒左右的视频片段相比,Sora模型生成的60秒视频实现了明显提升。

Sora模型实现视频时长突破的主要功臣是它所采用的Diffusion Transformer架构。该架构由Sora模型的主要作者Bill Peebles在2022年刚刚提出,才在ICCV 2023大会上做过介绍。

按照Bill Peebles在论文中的说法,他将Transformer结构替代了Diffusion模型中常用的U-Net结构,并将图像输入转化成了Patch(类似语言模型中输入的Token),得到了新的Diffusion Transformers架构,提升了原来Diffusion模型在深度和宽度上的可扩展性,为视频模型增加输出时长奠定了基础。

实际上,不仅Sora模型背后的Diffusion Transformer架构才面世不久,就连Sora技术报告后引用的32篇研究论文中,绝大多数也都是近3年新发布的研究结果。

研究驱动和融资驱动已成为AI发展的关键要素

回首2017年Transformer研究论文面世后,2019年就出现了首个GPT模型的发展成果。而近两年刚刚提出Diffusion Transformer的研究论文,很快就转化成了Sora模型这样的突破性产品。

如今AI领域的重要变化,往往不是来自于某个功能或应用层面,而是发源于底层架构的研究创新。研究驱动正在AI发展中起到越来越关键的作用。

另一方面,有了Diffusion Transformer这样的研究创新后,往往也是在OpenAI这样资源雄厚的机构中才能做的出来。

在开发阶段,把Diffusion Transformer的研究落地成Sora的产品需要投入大量的预训练、数据、工程资源。而在Sora服务正式推出后,运营推理过程中的资源消耗和算力成本也不可小视,融资驱动也正在成为AI发展的必要条件。

从Sora模型这个例子也能看出,要深度理解AI领域的关键动向,如今必须要从研究层面和融资层面进行观察和跟踪,从而更好地洞察AI发展的未来走势。

相关内容

热门资讯

斗金订购APP贵金属期货投资被...   斗金订购APP的投资者被广告宣传给诱导,注册就送什么现金,然后充值返现金卷等等这些宣传方式,都是...
哈易购APP非法期货交易欺骗投...   哈易购APP宣传可做白银铂金贵金属订购交易,但实际上并没有取得相关交易资质!哈易购APP本质上就...
消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...