电影里的人工智能照进现实?GPT-4o挑战苹果Siri 电影里的人工智能真的很现实吗 电影里的人工智能ai
admin
2024-05-14 23:00:45
0

电影里的人工智能已经照进现实?当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。在现场演示中,GPT-4o能实现接近人类反应时间的实时交互,能帮助用户实时解答数学方程式,甚至还能实时听人类呼吸声判断深呼吸节奏是否正确、给出实时情感反馈。 不少网友在看完发布会后表示,升级后的GPT-4o似乎是更智能版的苹果Siri。近期有媒体报道称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。



南都记者了解获悉,GPT-4o的升级迭代主要在于四方面:一是融媒能力更强,GPT-4o已同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答;二是速度更快、反应时间接近人类;三是GPT-4o将面向ChatGPT的所有付费和免费用户发布;四是ChatGPT在不用注册即可使用的基础上,还增加了桌面程序,交互更便利。

在融媒能力方面,发布会上,研究主管Mike Chen和Beridzov轮番演示。当Mike Chen向GPT-4o表示自己在发布会上比较紧张时,GPT-4o快速安慰“别紧张,深呼吸,记住你可是专家”。当Mike Chen顽皮地假装遵从GPT-4o的建议,“激烈”地呼吸时,GPT-4o发出了笑声并调侃“你不是吸尘器”,并一对一实时指导Mike Chen呼吸要诀,当“察觉”到Mike Chen呼吸正常时,GPT-4o赞许地表示“就是这样”。

据Mike Chen总结介绍,用户使用GPT-4o可以感受到以下几方面的升级:一是用户可以随时打断模型,不用等到模型完成一个回合即可插话,二是模型升级后能实时响应、没有时延,三是模型学会了情感解读。后续根据研究主管Beridzov的演示,当Beridzov将手机镜头拍摄自己在一张纸上演示线性方程式时,GPT-4o能实时给予指导和解法。

发布会上, OpenAI 的首席技术官 Mira Murati还介绍,GPT-4o的文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,但速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。



同时,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍,普通用户达到使用上限后会切换回GPT-3.5版本。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

英伟达科学家 Jim Fan发表评论称,从技术角度来看,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。



他还表示,GPT-4o更接近GPT-5了,在Google明天将举行的I/O 大会之前发布,OpenAI赢得了更多时间、非常明智。而GPT-4o也更加活泼,更像电影中的《她》了,更像是向一个更具情感和个性的 AI 转变,此前OpenAI 似乎一直在积极抑制这种变化。

据悉,OpenAI本次现场演示选择的声音是“Sky”,该声音听起来酷似科幻爱情片《她(Her)》中的“萨曼莎”。该电影讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声“萨曼莎”,“萨曼莎”嗓音性感、风趣幽默、善解人意,让孤独的男主泥足深陷。而“萨曼莎”的配音演员正是斯嘉丽·约翰逊。

发布会当天,奥特曼自己也在X上发了这部电影的名字《她(Her)》,还有人干脆把电影海报里的脸换成了奥特曼的。



不少网友看完发布会的第一感觉是,升级后GPT-4o似乎正在挑战苹果Siri。不过前不久,有媒体报道称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

Jim Fan强调,“谁先赢得苹果谁将大获全胜”。在Jim Fan看来,GPT-4o与苹果iOS可以在三个层次上整合。“一是抛弃 Siri。OpenAI 为 iOS 提炼出一个更小层级、纯粹设备上的 GPT-4o,可选择付费升级以使用云端;二是将摄像头或屏幕传输到模型的原生功能里,芯片级支持神经音频/视频编解码器;三是与 iOS 系统级操作API和智能家居 API 集成。这可能会成为从一开始就拥有10亿用户的 AI 代理产品。”

在发布会之外,OpenAI CEO萨姆·奥特曼发布博文表示,GPT-4o新的语音(和视频)模式是自己用过的最好的计算机界面。“感觉就像电影里的人工智能一样;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”

奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠价格)向人们提供功能强大的人工智能工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了世界上最好的模型,并且没有广告或类似的东西。我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。”

采写:南都记者 林文琪

相关内容

热门资讯

盘前:科技股热潮降温 纳指期货... 来源:环球市场播报 周五,美国股指期货下跌。科技股走弱、美国国债收益率上升拖累大盘。科技板块近期大...
600096,拟投建1000万... 今日(5月15日),三大股指均收跌,全市场成交额为3.37万亿元,较上一个交易日缩量179亿元。收盘...
原创 应... 当地时间5月14日美股盘后,半导体设备达成应用材料(Applied Materials)公布了202...
歌手温岚被紧急送入ICU,主办... 歌手温岚原定于5月16日在上海举办巡回演唱会。15日,有消息称温岚因身体不适被紧急送医,随后,演唱会...
闪迪、美光越涨越便宜?股价暴涨... 存储芯片需求的爆炸式增长正在颠覆传统估值逻辑——股价越涨,闪迪和美光反而越便宜。 闪迪今年以来股价累...
监管部门“5·15”密集发声,... 监管新规密集发布,投资者保护防线再加固。 5月15日,证监会在北京举办2025年“5·15全国投资者...
纳指、标普500指数续创新高!... 美股三大指数集体收涨,纳指涨0.88%,标普500指数涨0.77%,道指涨0.75%。其中,纳指、标...
欧洲主要股指收盘集体下跌 英国富时100指数跌1.71%,法国CAC40指数跌1.72%,德国DAX30指数跌2.11%,富时...
巴宝莉去年扭亏盈利近两亿元,进... 英国奢侈品牌Burberry巴宝莉公布截至3月28日的2026财年业绩,释放明显复苏信号。集团营收同...
腾澎投资拟减持巨人网络不超3%... 巨人网络公告显示,公司控股股东一致行动人、第二大股东上海腾澎投资合伙企业(有限合伙)(下称“腾澎投资...
医疗健康领域投融资日报(5月1... 据亿欧数据统计,昨日(2026年5月14日)共披露23起投融资事件,涉及15家国内企业,8家国外企业...
债市ETF“工具箱”,解锁固收... 当前,市场波动有所加大,不确定性因素较多,单一资产投资模式难以有效应对市场起伏,引入固收类资产、优化...
招商蛇口股东会通过博时蛇口产园... 观点网讯:5月15日,招商蛇口2026年第一次临时股东会在公司总部会议室召开,会议由董事长朱文凯主持...
《学习时报》刊文:全球海洋可再... 海洋可再生能源一般指蕴藏于海水水面、水体及海床之中,可转化为电能的清洁能源类型,主要包括海上风能、潮...
数据看盘游资、量化抢筹多只机器... 沪深股通今日合计成交4353.39亿,其中澜起科技和中际旭创分居沪股通和深股通个股成交额首位。板块主...
土耳其BIST-100指数下跌... 土耳其BIST-100指数下跌1.8%,主要银行指数下跌2.4%。 来源:金融界AI电报
15分钟动态电价时代:园区光伏... 一、电价改革的“加速度”:从分时计费到现货波动 过去,工商业用户的电价表一年可能只调整几次,峰、平、...
湘潭上元产业港:多套成交 12... 湘潭上元产业港再迎成交热潮,近期3套优质厂房成功签约,多位企业家携手落子,以实力见证长株潭热土的产业...
4月新增人民币贷款跌入负区间,... 本报(chinatimes.net.cn)记者刘佳 北京报道 作为观察货币政策传导效率的核心窗口,4...
2.2/7.2馆展位图首发!5... 【2.2馆展位图】 【7.2馆展位图】 Bakery china 2.2馆部分 企业推介 22B...