电影里的人工智能照进现实?GPT-4o挑战苹果Siri 电影里的人工智能真的很现实吗 电影里的人工智能ai
admin
2024-05-14 23:00:45
0

电影里的人工智能已经照进现实?当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。在现场演示中,GPT-4o能实现接近人类反应时间的实时交互,能帮助用户实时解答数学方程式,甚至还能实时听人类呼吸声判断深呼吸节奏是否正确、给出实时情感反馈。 不少网友在看完发布会后表示,升级后的GPT-4o似乎是更智能版的苹果Siri。近期有媒体报道称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。



南都记者了解获悉,GPT-4o的升级迭代主要在于四方面:一是融媒能力更强,GPT-4o已同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答;二是速度更快、反应时间接近人类;三是GPT-4o将面向ChatGPT的所有付费和免费用户发布;四是ChatGPT在不用注册即可使用的基础上,还增加了桌面程序,交互更便利。

在融媒能力方面,发布会上,研究主管Mike Chen和Beridzov轮番演示。当Mike Chen向GPT-4o表示自己在发布会上比较紧张时,GPT-4o快速安慰“别紧张,深呼吸,记住你可是专家”。当Mike Chen顽皮地假装遵从GPT-4o的建议,“激烈”地呼吸时,GPT-4o发出了笑声并调侃“你不是吸尘器”,并一对一实时指导Mike Chen呼吸要诀,当“察觉”到Mike Chen呼吸正常时,GPT-4o赞许地表示“就是这样”。

据Mike Chen总结介绍,用户使用GPT-4o可以感受到以下几方面的升级:一是用户可以随时打断模型,不用等到模型完成一个回合即可插话,二是模型升级后能实时响应、没有时延,三是模型学会了情感解读。后续根据研究主管Beridzov的演示,当Beridzov将手机镜头拍摄自己在一张纸上演示线性方程式时,GPT-4o能实时给予指导和解法。

发布会上, OpenAI 的首席技术官 Mira Murati还介绍,GPT-4o的文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,但速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。



同时,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍,普通用户达到使用上限后会切换回GPT-3.5版本。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

英伟达科学家 Jim Fan发表评论称,从技术角度来看,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。



他还表示,GPT-4o更接近GPT-5了,在Google明天将举行的I/O 大会之前发布,OpenAI赢得了更多时间、非常明智。而GPT-4o也更加活泼,更像电影中的《她》了,更像是向一个更具情感和个性的 AI 转变,此前OpenAI 似乎一直在积极抑制这种变化。

据悉,OpenAI本次现场演示选择的声音是“Sky”,该声音听起来酷似科幻爱情片《她(Her)》中的“萨曼莎”。该电影讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声“萨曼莎”,“萨曼莎”嗓音性感、风趣幽默、善解人意,让孤独的男主泥足深陷。而“萨曼莎”的配音演员正是斯嘉丽·约翰逊。

发布会当天,奥特曼自己也在X上发了这部电影的名字《她(Her)》,还有人干脆把电影海报里的脸换成了奥特曼的。



不少网友看完发布会的第一感觉是,升级后GPT-4o似乎正在挑战苹果Siri。不过前不久,有媒体报道称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

Jim Fan强调,“谁先赢得苹果谁将大获全胜”。在Jim Fan看来,GPT-4o与苹果iOS可以在三个层次上整合。“一是抛弃 Siri。OpenAI 为 iOS 提炼出一个更小层级、纯粹设备上的 GPT-4o,可选择付费升级以使用云端;二是将摄像头或屏幕传输到模型的原生功能里,芯片级支持神经音频/视频编解码器;三是与 iOS 系统级操作API和智能家居 API 集成。这可能会成为从一开始就拥有10亿用户的 AI 代理产品。”

在发布会之外,OpenAI CEO萨姆·奥特曼发布博文表示,GPT-4o新的语音(和视频)模式是自己用过的最好的计算机界面。“感觉就像电影里的人工智能一样;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”

奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠价格)向人们提供功能强大的人工智能工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了世界上最好的模型,并且没有广告或类似的东西。我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。”

采写:南都记者 林文琪

相关内容

热门资讯

疑似新模型海外惊艳!智谱再度飙... 格隆汇2月10日|延续昨日强势,港股市场AI概念股今日再度集体走强,其中,“全球大模型第一股”智谱(...
原创 特... 特朗普上任已逾一年,他推行的关税政策像一阵狂风,搅动了全球的经贸秩序。对于美国经济的未来走向,诺贝尔...
原创 一... 2026年2月9日晚的美股市场,上演了一场让很多投资者既兴奋又意外的行情。 本以为大涨之后总要歇一歇...
电商领域侵权问题获关注,知识产... 2月10日,知识产权保护概念持续拉升,截至发稿,成分股读客文化(301025.SZ)、中文在线(30...
原创 1... 12艘满载着俄罗斯乌拉尔原油的超级油轮,正像一群迷路的巨鲸,散落在从马六甲海峡到中国南海的广阔水域里...
凯思凯迪完成近5亿融资:中平资... 雷递网 乐天 2月10日 凯思凯迪宣布近期完成近5亿元新一轮融资,本轮融资由中平资本领投,国寿资本、...
美国出现小米YU7测试车?雷军... 近日,网上传出小米YU7 MAX测试车出现在美国道路的消息,难不成小米汽车要进军美国市场了? 事实...
2026-2032年中国食糖行... 共研网发布的《2026-2032年中国食糖行业深度调研与市场调查预测报告》共十二章。首先介绍了食糖行...
原创 美... 特朗普上台后不久,便对进口产品挥起了关税大棒。从钢铝到汽车零部件,一系列严苛的关税政策自2025年春...
盘中必读|字节旗下Seedan... 2月10日,AI短剧概念延续强势,荣信文化(301231)、捷成股份(300182)、欢瑞世纪(00...
2月25日起预约!申请退税别错... 近日,国家税务总局发布通告,明确2025年度个人所得税综合所得汇算清缴办理时间为2026年3月1日至...
再迎反弹!现货黄金重回5000... 贵金属再迎反弹。 2月9日,黄金、白银价格同步拉升。现货黄金再次突破关键阻力位,重回5000美元/盎...
YU7现身加州高速,小米会不会... 2月10日,雷军发文: 前段时间,一辆YU7行驶在美国加州的高速公路上,挂着当地的测试车牌。 很多人...
宁波迎来开年第一股!爱芯元智港... 转自:东南财金 2月10日,爱芯元智(0600.HK)正式于港交所主板挂牌上市,成为港股边缘计算AI...
2026年春节档新片预售票房已... 2月10日,市场早盘窄幅震荡,三大指数小幅下跌,北证50指数盘中跌超1%。沪深两市半日成交额1.39...
原创 俄... 俄罗斯黄金大量涌入中国,这背后究竟隐藏了怎样的玄机?根据2025年海关的数据,单单实物净进口量就高达...
亚太药业:聘任邱中勋为公司总经... 每经AI快讯,亚太药业2月9日晚间发布公告称,因公司控制权已发生变更,根据《股份转让协议》约定等相关...
原创 中... 我们中国的女富豪中,不乏靠着刻苦努力一步步爬上顶端的典型,也有不少依靠精准眼光与幸运投资一跃而成的成...
黄金交易提醒:美元疲软+央行“... 汇通财经APP讯——2026年2月的第二个星期,全球金融市场的心脏,似乎正随着那剧烈跳动。金价在50...
多措并举推动投资止跌回稳 国家统计局数据显示,2025年,全国固定资产投资同比下降3.8%。分领域看,基础设施投资下降2.2%...