9.11比9.9大?马斯克声称“天下最聪明”的Grok3“翻车了”
创始人
2025-02-20 08:35:14
0

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

海外主流大模型答题。图源:第一财经

Grok-3发布会的背景板上,写着"our mission is to understand universe(我们的使命是了解宇宙)"。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

在一周前,马斯克在直播中评论DeepSeek R1时,曾信心满满地表示“xAI即将推出更优秀的AI模型”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。

不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

(九派新闻)

相关内容

热门资讯

沃尔核材,第三家不设绿鞋上市首... 行情来了,A+H股澜起科技暗盘大涨41%,放在以前这是想都不敢想的事。曾经被视为“鸡肋”的A股赴港二...
央行连续15个月增持黄金! 国家外汇管理局(下称“外汇局”)2月7日发布的最新统计数据显示,截至2026年1月末,我国外汇储备规...
上海铂金回收高效变现:手续极简... 上海宝易埠:铂金回收高效变现,手续极简,安全放心 在上海这座繁华的国际化大都市,珠宝首饰的交易市场异...
1月末外储规模环升1.23%,... 2月7日,国家外汇管理局统计公布数据显示,截至2026年1月末,我国外汇储备规模为33991亿美元,...
央行连续第15个月增持黄金 中国央行再度增持黄金。 国家外汇管理局(下称“外汇局”)2月7日发布的最新统计数据显示,截至2026...
适应金融监管实际需要 银行保险... 金融监管总局2月6日修订发布《银行保险机构许可证管理办法》,适应金融监管实际需要,进一步规范、调整许...
逛吃全球尖货!进口优品体验周在... 2月6日,“全球甄选 悦享生活”进口优品体验周启动仪式暨北京首都国际机场临空经济区进口贸易系列创新政...
涉不如实记录保险业务事项等违法... 2月6日,国家金融监督管理总局江西监管局行政处罚信息公开表显示,因未如实记录保险业务事项、未按照规定...
“全市场产品货架”打法如何搅动... 财联社2月7日讯(记者 闫军)基金公司财富子公司领域,正杀出了一匹黑马。 财联社记者从易方达基金子公...
中国神华重组提交注册 为首单适... 中证报中证网讯(记者 刘丽靓)2月6日,中国神华能源股份有限公司的千亿级资产重组项目迎来新进展。根据...
王小卤霉变、麦当劳翻车、周生生... 本文全篇2792字,预计阅读6分钟。 栏目导读:我们不仅报道热点,更致力于拆解其背后的商业逻辑、利益...
原创 很... 文/王新喜 北京时间1月31日凌晨,现货白银价格一度暴跌36%,创出历史最大日内跌幅;现货黄金价格一...
同仁堂大宗交易折价成交10.0... 同仁堂02月06日大宗交易平台共发生1笔成交,合计成交量10.00万股,成交金额315.30万元。成...
A股回归理性利在长远 桂浩明 自前年“9·24行情”以来,A股市场出现了持续震荡上行的格局,稳步向上成为最基本的特点之一。...
原创 求... 2026年1月1日《求是》明确“政策一次性给足”,同一天市场还在观望; 一月新房仅环涨0.18%、二...
“最贵新股”上市以来首亏 “微... 来源:猫头鹰车志 作者:Sogear 从“中签狂赚十万元”的最贵新股到如今破发的“套牢地”,禾迈股...
全面优化消费环境 擦亮“吴优”... 近日,省市场监管局召开全省优化消费环境促进放心消费工作推进会。省局党组书记、局长沈海斌出席并讲话。苏...
原创 男... 在爱情的旅途中,每个人都渴望与那个对的人携手共度余生。然而,当一段关系走到尽头,分手似乎成了不可避免...
SpaceX调整计划 优先登月... 据《华尔街日报》报道,埃隆·马斯克领导的SpaceX公司已向投资者透露,将优先考虑登月计划,并将火星...
中物联:指数升至50%以上,全... 人民财讯2月6日电,中国物流与采购联合会发布,2026年1月份全球制造业PMI为51%,较上月上升1...