见证历史,OpenAI王炸!响应速度达到人类级别 openai王炸发布 见证历史祝贺马斯克
admin
2024-05-14 18:12:27
0


作 者丨孔海丽 肖潇

编 辑丨朱益民 王俊

北京时间5月14日凌晨,OpenAI再放大招,新推出的GPT-4o改写了大模型交互定义,可以实时对音频、视觉和文本进行推理,语音响应时间短至232毫秒,与人类反应速度一致,在无延迟语音对话中,GPT-4o的节奏、语气甚至接梗,与真人无异,视频实时交互也不在话下。

GPT-4o的惊艳面世,不负此前Sam Altman铺垫过的“魔法般体验”,而人类拥有全能AI助手的梦想,也被OpenAI大幅推进。有业内人士惊呼:科幻《她》真的到来了。


发布会现场


先进智能体:多模态交互与情感识别

GPT-4o的“o”代表“omni”,象征着全能。该模型多模态交互能力突出,能够接受文本、音频和图像的“混搭”输入,快速响应完成推理,生成文本、音频和图像的组合输出。

音频输入层面,GPT-4o击穿了此前Siri等智能语音助手的延迟弊端,取得突破性进展。其响应速度之快,达到了人类级别,至短232毫秒,平均320毫秒。

此外,新模型展现出对人类交流习惯的高度理解力和适应性。GPT-4o能以听起来非常自然的人类声音说话,并且发出多种语气词,表现了此前AI音频所未能达到的张力和可塑性。它能够接受人类交谈中的打断习惯,及时停顿并给出无缝回复,并且保持对上下文的记忆。这种自然的交互体验,让人几乎感觉不到与机器的界限。

视频输入方面,GPT-4o可以及时响应高管开启摄像头的视频需求指令,实时解决一元方程的数学计算,整个过程同样丝滑迅速。

GPT4-o还展示出对图片信息的快速解读能力,用AI读复杂图片正在变为现实。发布会现场,桌面版ChatGPT对一张包含气温数据的图表进行了详细的分析。

GPT-4o能说多国语言,实时提问时就说了一段意大利语。它还具有记忆功能,这意味着它可以从之前与用户的对话中学习。

市面上已有一部分情感型人工智能机器人,比普通人工智能助手更能准确识别人类情绪。然而,上述功能多停留在文本中,GPT-4o的情绪检测功能则扩展至视频领域。

发布会现场,研究人员将手机摄像头对准自己的脸,向GPT-4o发起了颇具挑战性的问题:“我看起来怎么样?”。GPT-4o初次回答将提问者的脸界定为“木质表面”。随后,GPT-4o在引导性提问下修正结果,准确分析出提问者的情绪状态是愉悦的、笑容满面的。

从底层技术分析,GPT-4o的先进之处在于,它革新了传统的多模型串联处理方式,能够通过单一的神经网络统一处理所有的输入和输出,无论是文本、视觉图像还是音频信息,都能得到精准高效的解析和回应。

Open AI颠覆了对传统AI助手的想象,与人类形成多模态的深度配合和自然交互。Open AI官方称,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,新模型在提供个性化服务和提升用户体验方面的潜力将不可限量。

而过去的AI助手迅速变得“传统”,其工作极有可能被GPT-4o替代。


新技术普惠:免费开放与端侧调用

因为生成式视频而大出风头的Sora,到现在仍没有向公众开放。

但OpenAI此次发布会为免费用户带来了好消息。

OpenAI 的首席技术官穆里・穆拉蒂 (Muri Murati) 在发布会上表示,以后 OpenAI 做产品就是要免费优先,为的就是让更多的人能使用。

不同于此前OpenAI在推出模型新版本都会对特定付费用户开放,本次GPT-4o的新功能将向所有用户敞开大门,可以免费运用模型进行更为复杂的数据分析,对图像进行深入的解析,访问GPT Store应用商店。

另外,此前仅对ChatGPT Plus会员开放的视觉、联网、记忆、执行代码等高级功能也将开放免费使用。一系列普惠举措,无疑将吸引大批用户涌入OpenAI平台,尝试丰富的AI体验。

技术研发者也将享受更多利好。发布会表示,GPT-4o模型的应用程序接口(API)将与模型同步向公众开放。API不仅升级了性能,还为开发者把价格打了下来。OpenAI给出了一系列令人惊喜的数据:推理速度较之前提升了2倍之多,消息限制则扩增为原来的五倍,使用成本则大幅下降了50%。

除了新模型的普惠举措,OpenAI发布了ChatGPT的桌面版本。穆里・穆拉蒂强调了桌面端以用户为中心的设计理念,模型变得复杂高级,但OpenAI力求消除用户与AI模型之间的隔阂,使用户能够更加自如地利用这些先进的技术工具。

OpenAI的这一决策,似乎在破除此前舆论场对OpenAI的闭源偏见。开放接口、免费试用、桌面落地体现了这家技术领头羊对于AI普及化的承诺,有望进一步丰富AI应用的技术生态。

不过,有专家指出,OpenAI选择谷歌大会前一天展示新产品,也显示出它面临着不小的竞争压力与增长焦虑。对用户来说,这并非坏事。


Sam Altman:希望开发出类似《她》那样的AI助理

值得注意的是,OpenAI首席执行官Sam Altman 没有在这场发布会上亮相,发布会结束后也只在社交媒体上发布了一个词——她(Her)。电影《她》正讲述了一名男性作家和一名人工智能语音助手建立了恋爱关系,GPT-4o和电影中斯嘉丽·约翰逊配音的“她”非常相似。

Sam Altman此前在采访中表示,希望最终能开发出一种类似《她》那样的AI助理。对于GPT-4o,他说:“我仍然有点惊讶它是真实的。事实证明,达到人类级别的响应时间和表现力是一个巨大的变化。”

人机交互的新模式也提高了AI与硬件的适配性。此前彭博社报道,OpenAI即将与苹果达成协议,将ChatGPT 安装在 iPhone 上,下个月苹果将举行WWDC全球开发者大会。不过Mira Murati此前透露,OpenAI 还没有讨论过任何合作关系。

前述英伟达高级科学家Jim Fan认为,谁先赢得苹果,谁就赢得了比赛。他分析ChatGPT可能在三个层面与苹果合作:第一,放弃Siri,让OpenAI 提炼出纯粹适用于移动端的小型GPT-4o;第二,将原生摄像头或屏幕流输入到模型中,芯片级支持神经音视频的编解码器;第三,与苹果系统级操作API和智能家居API结合。这可能会成为起步就拥有十亿用户的AI代理产品。

需要注意的是,OpenAI接下来将致力于保证GPT-4o的可用性和安全性,比如音频输出只能选择预设好的声音。此外,OpenAI仍然没有透露GPT-4o的训练数据来源,分析认为数据主要来自YouTube、播客、电视剧、电影等作品中自然发生的对话。OpenAI表示之后会在AI系统卡(system card)中分享更多详细信息。

SFC

本期编辑 黎雨桐 实习生 黄丽鸿

21君荐读

相关内容

热门资讯

盘前:科技股热潮降温 纳指期货... 来源:环球市场播报 周五,美国股指期货下跌。科技股走弱、美国国债收益率上升拖累大盘。科技板块近期大...
600096,拟投建1000万... 今日(5月15日),三大股指均收跌,全市场成交额为3.37万亿元,较上一个交易日缩量179亿元。收盘...
原创 应... 当地时间5月14日美股盘后,半导体设备达成应用材料(Applied Materials)公布了202...
歌手温岚被紧急送入ICU,主办... 歌手温岚原定于5月16日在上海举办巡回演唱会。15日,有消息称温岚因身体不适被紧急送医,随后,演唱会...
闪迪、美光越涨越便宜?股价暴涨... 存储芯片需求的爆炸式增长正在颠覆传统估值逻辑——股价越涨,闪迪和美光反而越便宜。 闪迪今年以来股价累...
监管部门“5·15”密集发声,... 监管新规密集发布,投资者保护防线再加固。 5月15日,证监会在北京举办2025年“5·15全国投资者...
纳指、标普500指数续创新高!... 美股三大指数集体收涨,纳指涨0.88%,标普500指数涨0.77%,道指涨0.75%。其中,纳指、标...
欧洲主要股指收盘集体下跌 英国富时100指数跌1.71%,法国CAC40指数跌1.72%,德国DAX30指数跌2.11%,富时...
巴宝莉去年扭亏盈利近两亿元,进... 英国奢侈品牌Burberry巴宝莉公布截至3月28日的2026财年业绩,释放明显复苏信号。集团营收同...
腾澎投资拟减持巨人网络不超3%... 巨人网络公告显示,公司控股股东一致行动人、第二大股东上海腾澎投资合伙企业(有限合伙)(下称“腾澎投资...
医疗健康领域投融资日报(5月1... 据亿欧数据统计,昨日(2026年5月14日)共披露23起投融资事件,涉及15家国内企业,8家国外企业...
债市ETF“工具箱”,解锁固收... 当前,市场波动有所加大,不确定性因素较多,单一资产投资模式难以有效应对市场起伏,引入固收类资产、优化...
招商蛇口股东会通过博时蛇口产园... 观点网讯:5月15日,招商蛇口2026年第一次临时股东会在公司总部会议室召开,会议由董事长朱文凯主持...
《学习时报》刊文:全球海洋可再... 海洋可再生能源一般指蕴藏于海水水面、水体及海床之中,可转化为电能的清洁能源类型,主要包括海上风能、潮...
数据看盘游资、量化抢筹多只机器... 沪深股通今日合计成交4353.39亿,其中澜起科技和中际旭创分居沪股通和深股通个股成交额首位。板块主...
土耳其BIST-100指数下跌... 土耳其BIST-100指数下跌1.8%,主要银行指数下跌2.4%。 来源:金融界AI电报
15分钟动态电价时代:园区光伏... 一、电价改革的“加速度”:从分时计费到现货波动 过去,工商业用户的电价表一年可能只调整几次,峰、平、...
湘潭上元产业港:多套成交 12... 湘潭上元产业港再迎成交热潮,近期3套优质厂房成功签约,多位企业家携手落子,以实力见证长株潭热土的产业...
4月新增人民币贷款跌入负区间,... 本报(chinatimes.net.cn)记者刘佳 北京报道 作为观察货币政策传导效率的核心窗口,4...
2.2/7.2馆展位图首发!5... 【2.2馆展位图】 【7.2馆展位图】 Bakery china 2.2馆部分 企业推介 22B...