原创 马斯克用20万块英伟达芯片练出Grok 3,印证了DeepSeek真的强
创始人
2025-02-22 13:36:19
0

文/王新喜

马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。

Grok 3是用20万块英伟达芯片练出来的,运算能力是上代10倍。

xAI在当天的直播中,马斯克与该公司的三位工程师一起进行了现场演示,Grok 3在数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。

据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。

从目前测试看,Grok3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试中成绩均高于DeepSeek。拥有“思维链”推理机制,能像人类一样逐步拆解复杂任务。参数量达1万亿级别。

Grok3 确实在不少任务上表现得很棒,例如在处理复杂逻辑和推理任务时,它的能力确实有东西。不过Grok3用海量GPU刷了榜单上的分数,数学、编程分高,其实也没好多少,没有拉开差距。而DeepSeek 的优势在于中文理解和多模态交互方面,它的表现一直很稳定,在实际应用场景中已经得到了不少验证。

最关键的问题在于,Grok3成本极其高,计算量是前代Grok 2的10倍,有说法是其训练成本就30亿美元,根据相关工程师透露xAI旗下超算中心算力已经翻倍。

去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行,不过要构建理想中的AI需将集群规模翻倍。发布会上透露,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。

20万块GPU多少钱?以英伟达H100为例,单卡价格约为2.5万-3万美元。20万块 × 3万美元 = 60亿美元(仅硬件采购成本)。这还只是GPU硬件成本,实际部署成本更高,还需考虑配套服务器、网络设备、电力、冷却设施等,总成本可能达百亿美元量级,砍一半也高达50亿美金。

Deepseek从训练成本来看仅有600万美元,远低于GPT-4的7800万美元。后续deepseek资金、人才、资源上去了,综合能力肯定不比Grok3差。

Grok 3,印证了DeepSeek真的强

这说明了什么,说明了两点,其一,马斯克花了那么多钱堆了比OpenAI还多的算力,最后搞出来个跟OpenAI差不多的产品。第二,这证明了DeepSeek真的强啊,马斯克大把烧美金当柴火搞炼丹,效果全靠堆硬件,而且从数据来看,和DeepSeek并没有拉开多少差距,DeepSeek那边走低成本路线都能差不多打平手,那只能更说明DeepSeek非常强。

因为这是两条不同的路线,一个是力大拍砖大力出奇迹坚定地砸钱堆算力,一个是创新的工程设计与高效的训练方法,优化节省资源追求极致性价比,是两条完全不同的路线。

堆算力的游戏,是让AI成为美国人主导算力资源分配的游戏。美国可以通过控制GPU芯片出口,精确调控全球AI生产力水平。并且把全球获取AI算力划分为三个等级圈,由它来控制分配,这让其他国家陷入绝望。

而且特朗普还投资5000亿美元的“星际之门”,目的就是将AI领先牢牢锁在美国本土,吸引把日韩、中东、欧洲等相关资金,把除中国外的其他实力国家牢牢绑在老美的AI战车之上。

而DeepSeek则打破了这种主导,给了其他所有国家看到了自主发展AI的希望,因为它在实现OpenAI模型的同等性能时,仅需要对方5%的算力,以低成本模式直接掀翻了美国一众科技巨头,这下所有的国家都觉得自己都能行了。因为,这意味着所有的国家都不需要依赖美国高算力GPU芯片资源了,而且还能把成本极大的降下来。

这是现在到处搞钱的特朗普特别看重的能力,DeepSeek的横空出世,为啥不光是英伟达、AMD等企业很快接入,特朗普也一反常态的点赞——他们就一个意思:省成本,省社会总成本,可以给整个国家省下老鼻子钱了。

而且在AI 大模型发展到现在,其实模型能力已经很难分出绝对的胜负了,在大指标不断趋同的背景下,开源才是大招,知名投资人朱啸虎曾经提出一个判断,开源模型的基础就是闭源模型的斩杀线,今后闭源模型必须要做到开源基础的两到三倍才有活下去的机会。否则十倍成本砸下去性能只提高20%,那即使是硅谷的投资人也不会接受这样的结果。

而真用起来如何,也只有开源的才能比较充分测试。不开源,人家还交钱用,还没什么特别领先的,商业模式就很难成立。

加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多无人问津,grok3单纯砸钱堆算力实现大火上演反转剧情的几率并不大。

如果不开源,马斯克巨大的投入无法变现,或会自用到自己的机器人和 FSD。不过话说回来,目前特斯拉FSD用户订阅并不高,但是Grok-3还是能增强FSD的竞争力。

因为Grok 3 基于10万块英伟达 H100 芯片训练,每秒可处理超过 1.5 万亿参数,能实时解析车载摄像头、雷达等传感器数据,比竞品在识别暴雨天气下道路积水深度的准确率高 37%,可帮助自动驾驶系统更精准地感知周边环境。

此外是Grok 3 引入 “思维链” 技术,可模拟人类逐步推理过程,在导航时能综合分析实时交通数据、充电桩可用性和用户日程推荐路线,在自动驾驶场景中,面对复杂路况和交通信号时能做出更合理、安全的决策。

如果特斯拉将其用到FSD,这意味着新能源车企的智驾竞争会更加激烈,对此中国的车企要有足够的认知与准备。

相对于Grok3,deepseek的优势是创新的工程设计与算法优化实现的超低成本、其次是开源模式的生态与技术优化能力会让未来包括美国在内的很多科研人员只能在东大的AI模型上搞开发了!东大有望成为世界AI的开发中心。加上我们举国之力支持,中国成百上千行业都在快速接入,促进它不断进化,和千行百业结合实践,产生生产力。未来发展潜力,可能不是Grok3能比的,我们拭目以待。

作者:王新喜 TMT资深评论人 本文未经许可谢绝转载

相关内容

热门资讯

蜜雪冰城市值再创新高,上市以来... 3月6日,港股蜜雪集团(02097.HK)延续强势,盘中一度涨超20%,市值再创新高,突破1300亿...
赤字率拟按4%左右安排!创历史... 华夏时报记者 张智 两会报道 在更加积极有为的宏观政策背景下,我国以提高赤字率全面带动经济回暖。 ...
华桥汇利(中国)投资基金管理有... 韩国央行近日发布的最新经济数据表明,去年韩国实际国内生产总值(GDP)增长百分之二,与该行在一月份的...
深市企业质量回报双提升,创业板... 截至收盘,创业板中盘200指数上涨3.6%,创业板指数上涨2%,深证50指数上涨1.7%,深证100...
VIP机会日报AI应用方向集体... 注:VIP为内容资讯产品,并非投资建议。以下内容仅为资讯价值展示非对相关公司的推荐建议,非未来走势预...
今世缘:虽然省外市场规模仍相对... 来源:酒业内参 近日,有投资者在互动平台向今世缘提问全国化相关事宜。 投资者表示,建议今世缘在江西省...
百威亚太迎来首位中国籍CEO,... 每经记者 谢振宇 每经编辑 彭水萍 上周,酒业的一些重要人事变动引发关注。百威亚太迎来首位中国籍C...
双创板块持续活跃,关注易方达上... 双创板块今日延续涨势,截至收盘,上证科创板50成份指数上涨3.5%,中证科创创业50指数上涨2.7%...
技术创新引领未来——北方资本赵... 在全球金融市场不断演进的浪潮中,技术创新正成为推动行业变革的重要力量。北方资本创始人赵庚禹,作为国内...
黄金,又变天了! 来源:金投网 隔夜,现货黄金小幅上涨,日内最高触及2929.67美元,最低触及2893.90美元,最...
瑞典支付企业Klarna Ba... 雷递网 乐天 3月6日 日前有消息称,瑞典支付企业Klarna Bank可能会在下周递交招股书,准备...
原创 中... 2025年,全球科技产业格局正在经历一场深刻的变革,曾经引领全球科技潮流的美国“七姐妹”苹果、谷歌、...
全国人大代表、舍得酒业陈柏蓉:... 2025年全国两会期间,全国人大代表、舍得酒业(600702.SH)生产技术中心酒体设计室设计师陈柏...
【全国两会访谈】张波代表:支持... 在全国两会现场,全国人大代表、山东魏桥创业集团有限公司董事长张波就民营经济发展及民营企业参与国家重大...
4只股票型ETF成交量超300... 每经AI快讯,据东方财富Choice数据统计,今日共4只股票型ETF成交量超3000万手,华夏上证科...
Meta、微软等纷纷布局!AI... 当地时间3月5日,美股三大指数集体走高,道指涨1.14%,标普500指数涨1.12%,纳指涨1.46...
中远海发(02866.HK)发... 中远海发(02866.HK)发布公告,于2025年3月6日,该公司斥资116.73万元回购50.11...
霸王茶姬赴美IPO获证监会备案... 封面新闻记者 舒俊瑜 3月6日,中国证监会传来消息,霸王茶姬品牌主体——茶姬控股有限公司,已获境外发...
胖东来没有神话 蓝鲨导读:情绪价值VS极致性价比 作者 | 蓝鲨消费 如今,中国已进入了以存量竞争为主的经济时代,多...