原创 马斯克用20万块英伟达芯片练出Grok 3,印证了DeepSeek真的强
创始人
2025-02-22 13:36:19
0

文/王新喜

马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。

Grok 3是用20万块英伟达芯片练出来的,运算能力是上代10倍。

xAI在当天的直播中,马斯克与该公司的三位工程师一起进行了现场演示,Grok 3在数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。

据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。

从目前测试看,Grok3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试中成绩均高于DeepSeek。拥有“思维链”推理机制,能像人类一样逐步拆解复杂任务。参数量达1万亿级别。

Grok3 确实在不少任务上表现得很棒,例如在处理复杂逻辑和推理任务时,它的能力确实有东西。不过Grok3用海量GPU刷了榜单上的分数,数学、编程分高,其实也没好多少,没有拉开差距。而DeepSeek 的优势在于中文理解和多模态交互方面,它的表现一直很稳定,在实际应用场景中已经得到了不少验证。

最关键的问题在于,Grok3成本极其高,计算量是前代Grok 2的10倍,有说法是其训练成本就30亿美元,根据相关工程师透露xAI旗下超算中心算力已经翻倍。

去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行,不过要构建理想中的AI需将集群规模翻倍。发布会上透露,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。

20万块GPU多少钱?以英伟达H100为例,单卡价格约为2.5万-3万美元。20万块 × 3万美元 = 60亿美元(仅硬件采购成本)。这还只是GPU硬件成本,实际部署成本更高,还需考虑配套服务器、网络设备、电力、冷却设施等,总成本可能达百亿美元量级,砍一半也高达50亿美金。

Deepseek从训练成本来看仅有600万美元,远低于GPT-4的7800万美元。后续deepseek资金、人才、资源上去了,综合能力肯定不比Grok3差。

Grok 3,印证了DeepSeek真的强

这说明了什么,说明了两点,其一,马斯克花了那么多钱堆了比OpenAI还多的算力,最后搞出来个跟OpenAI差不多的产品。第二,这证明了DeepSeek真的强啊,马斯克大把烧美金当柴火搞炼丹,效果全靠堆硬件,而且从数据来看,和DeepSeek并没有拉开多少差距,DeepSeek那边走低成本路线都能差不多打平手,那只能更说明DeepSeek非常强。

因为这是两条不同的路线,一个是力大拍砖大力出奇迹坚定地砸钱堆算力,一个是创新的工程设计与高效的训练方法,优化节省资源追求极致性价比,是两条完全不同的路线。

堆算力的游戏,是让AI成为美国人主导算力资源分配的游戏。美国可以通过控制GPU芯片出口,精确调控全球AI生产力水平。并且把全球获取AI算力划分为三个等级圈,由它来控制分配,这让其他国家陷入绝望。

而且特朗普还投资5000亿美元的“星际之门”,目的就是将AI领先牢牢锁在美国本土,吸引把日韩、中东、欧洲等相关资金,把除中国外的其他实力国家牢牢绑在老美的AI战车之上。

而DeepSeek则打破了这种主导,给了其他所有国家看到了自主发展AI的希望,因为它在实现OpenAI模型的同等性能时,仅需要对方5%的算力,以低成本模式直接掀翻了美国一众科技巨头,这下所有的国家都觉得自己都能行了。因为,这意味着所有的国家都不需要依赖美国高算力GPU芯片资源了,而且还能把成本极大的降下来。

这是现在到处搞钱的特朗普特别看重的能力,DeepSeek的横空出世,为啥不光是英伟达、AMD等企业很快接入,特朗普也一反常态的点赞——他们就一个意思:省成本,省社会总成本,可以给整个国家省下老鼻子钱了。

而且在AI 大模型发展到现在,其实模型能力已经很难分出绝对的胜负了,在大指标不断趋同的背景下,开源才是大招,知名投资人朱啸虎曾经提出一个判断,开源模型的基础就是闭源模型的斩杀线,今后闭源模型必须要做到开源基础的两到三倍才有活下去的机会。否则十倍成本砸下去性能只提高20%,那即使是硅谷的投资人也不会接受这样的结果。

而真用起来如何,也只有开源的才能比较充分测试。不开源,人家还交钱用,还没什么特别领先的,商业模式就很难成立。

加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多无人问津,grok3单纯砸钱堆算力实现大火上演反转剧情的几率并不大。

如果不开源,马斯克巨大的投入无法变现,或会自用到自己的机器人和 FSD。不过话说回来,目前特斯拉FSD用户订阅并不高,但是Grok-3还是能增强FSD的竞争力。

因为Grok 3 基于10万块英伟达 H100 芯片训练,每秒可处理超过 1.5 万亿参数,能实时解析车载摄像头、雷达等传感器数据,比竞品在识别暴雨天气下道路积水深度的准确率高 37%,可帮助自动驾驶系统更精准地感知周边环境。

此外是Grok 3 引入 “思维链” 技术,可模拟人类逐步推理过程,在导航时能综合分析实时交通数据、充电桩可用性和用户日程推荐路线,在自动驾驶场景中,面对复杂路况和交通信号时能做出更合理、安全的决策。

如果特斯拉将其用到FSD,这意味着新能源车企的智驾竞争会更加激烈,对此中国的车企要有足够的认知与准备。

相对于Grok3,deepseek的优势是创新的工程设计与算法优化实现的超低成本、其次是开源模式的生态与技术优化能力会让未来包括美国在内的很多科研人员只能在东大的AI模型上搞开发了!东大有望成为世界AI的开发中心。加上我们举国之力支持,中国成百上千行业都在快速接入,促进它不断进化,和千行百业结合实践,产生生产力。未来发展潜力,可能不是Grok3能比的,我们拭目以待。

作者:王新喜 TMT资深评论人 本文未经许可谢绝转载

相关内容

热门资讯

消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...
澳大利亚审慎监管局拟放宽银行风... 澳大利亚审慎监管局(APRA)6月29日就修改 银行信用风险资本设定公开征求意见,旨在加大信贷投放以...
全民炒股,急踩刹车!韩国股市突... 屈红燕/证券时报网 全民狂欢、交易高度拥挤、杠杆资金猛增、新入市投资者表现激进、大型IPO吸金等现象...