9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”
创始人
2025-02-20 08:35:14
0

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

(九派新闻)

相关内容

热门资讯

原创 美... 美国诺克斯堡金库,那座号称囤积了4500吨黄金的神秘仓库,再次成为舆论焦点。而美国总统特朗普,这位以...
东方嘉富人寿:童超当选公司董事... 北京商报讯(记者 李秀梅)5月13日,东方嘉富人寿保险有限公司(以下简称“东方嘉富人寿”)公告,根据...
布朗32分孙铭徽复出 浙江广厦... 【搜狐体育战报】北京时间5月13日CBA季后赛,主场作战的浙江浙商证券以91-67击败山西汾酒,伤缺...
原创 外... 外汇储备被网友戏称为“金融核武”,因为其不仅在稳定汇率、保障经济安全上发挥关键作用,还有助于推动人民...
美股首只纯存储ETF,刷新华尔... 财联社5月13日讯(编辑 史正丞)近期存储芯片板块的猛烈上涨,使得一只成立不到6周的ETF成为华尔街...
光纤热门股连夜澄清:与英伟达不... 5月13日晚,通鼎互联(002491)发布澄清公告表示,公司与英伟达不存在任何业务关系。 通鼎互联...
原创 梁... 今年4月,DeepSeek突然传出要融资的消息。这事搁一年前,没人敢信。 梁文峰从2023年创立De...
开盘暴涨170%!年度AI制药... 来源:E药资本界 “全球AI纳米递送第一股”剂泰科技正式登场,一举刷新2026港股IP0多项记录。...
2025年CXO行业净利暴增8... 图源:图虫创意 来源丨时代商业研究院 作者丨陆烁宜 编辑丨郑琳 2025年,CXO龙头药明康德(60...
高纯半导体材料供应商科利德重启... 作者|杨溪 编辑|蒋舟 沪深两市 辅导备案登记受理 5月7日-5月11日,有2家公司境内(沪深两市)...
*ST宝馨:股价异动,公司股票... 5月13日,*ST宝馨(002514.SZ)发布股价异常波动暨风险提示性公告,公司股票交易价格连续3...
江苏首投!国家级基金出手 省战新母基金参与的国家创业投资引导基金首批区域基金——长三角创业投资引导基金(简称“长三角基金”),...
原创 中... 近日,日本与澳大利亚在堪培拉举行了一次正式会晤,双方联合发布了一份重量级声明,传递出明确而强烈的信号...
原创 特... 在当前全球经济舞台上,中国和美国之间的微妙互动愈发引人注目。特朗普率领一支“豪华天团”访华,意在推动...
央行:银行债券投资是货币创造重... 每经记者|张寿林 每经编辑|许绍航 5月11日,人民银行披露一季度中国货币政策执行报告,其中设专栏...
原创 美... 多家国际投行近期密集释放对中国房地产市场的积极信号,普遍看好一线城市修复前景。 乐观判断的背后,既有...
两年集聚227家区块链企业,上... 一份中药从田间地头到患者手中,一份校园餐从食材产地到后厨案头,一张电子票根从活动本身延伸到周边消费优...
百度Create大会李彦宏首提... 紫金财经5月13日消息 今日晚间,百度美股开盘上涨超7%。当天,百度Create2026 AI开发者...
中国这个县 造船量比日本整个国... 2026年2月,全球新船订单共186艘,中国船厂接走151艘,而日本船厂接到的单子是0。 这不是偶然...
中国造船业三大指标领跑全球!山... 海报新闻编辑 刘美显 5月9日,工业和信息化部发布我国造船业最新数据,一季度,我国造船完工量、新接订...