讲真,马斯克的Grok-3,“碰瓷”不了DeepSeek
创始人
2025-02-24 19:33:05
0

撰文 | 雁 秋

编辑 | 李信马

题图 | 豆包AI

前不久,一场高规格民企座谈会让坊间议论纷纷。这是中央时隔6年3个月再度专门召开民营企业座谈会,会上,中国互联网和科技产业的精英齐聚一堂,释放出新质生产力、科技创新产业向好的趋势。

年轻的梁文峰也在其中,他与任正非、曾毓群等老一辈企业家同座,而他的DeepSeek正成为在场各家业务的连接桥梁。

没过多久,马斯克旗下xAI公司突然发布新一代大语言模型Grok-3,号称是“地球上最聪明的人工智能”,计算能力是去年8月发布的Grok 2的10倍,推理能力超越包括ChatGPT和DeepSeek在内的其他领先AI模型。

一场横跨太平洋的“AI对战”瞬间点燃科技圈,在外界看来,Grok 3令AI行业竞争更加激烈。谁是在实验室里“秀肌肉”,谁又能将技术变成实实在在的生产力,是未来这场风暴的中心。

01、训练:一个赌“壕气”,一个用“巧思”

Grok-3是马斯克与团队xAI为挑战OpenAI、ChatGPT而精心打造的产品,被称为“地球上最聪明的人工智能”。

在官方的直播演示中,Grok-3和Grok-3 mini在数学、科学和编程基准测试上,超越了包括GPT-4o、DeepSeek-V3和Gemini-2 Pro等主流模型。

同时,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning则超越了DeepSeek-R1和OpenAI的o3 mini等。

看得出,DeepSeek已经与头部大模型比肩。

自打这个国产大模型爆火后,包括硅谷在内的许多AI公司都开始重新评估用堆算力和参数来推进所谓的“扩展法则”,是否仍然适用。因为DeepSeek颠覆了以往发展AI就是要不断的堆算力、堆GPU的烧钱路子,而是采用了一条分布式算力+混合云优化的路线:通过动态调度公有云、私有服务器甚至边缘计算资源,结合自研的模型压缩技术(如稀疏化训练),在千亿参数规模下实现了训练成本降低40%以上。

然而目前看来,马斯克并不这么认为。事实上,xAI一直是追求“大力出奇迹”的代表,相关负责人表示:

“如果你看看所有性能的来源,当你有一个非常强大的工程团队和最优秀的AI人才时,唯一需要的就是一个强大的集群,才能产生巨大的智能。”

某种意义上,Grok3也是大力出奇迹的结果,马斯克为其攒下了“壕”无人性的算力家底。据了解,xAI团队在122天内让第一批10万块GPU投入使用,是“目前最大的完全连接的H100集群”。之后又用了92天的时间,将数据中心的容量继续翻倍,并基于这些成果构建出了Grok-3。

而被拿来进行对比的DeepSeek-V3模型,则是在配备了2048个英伟达H800 GPU的集群上进行训练的。H800是英伟达特供中国市场的AI芯片,在性能上不及先进的H200、H100等。

虽然如此,拥有更高集群的Grok-3在演示时也未呈现出“地球最聪明”的状态。直播中Grok-3一度“思考卡壳”,在任务时因为显示“Thinking Hard”后很长一段时间没有反应,等待几秒后演示人员关闭了页面开启下一话题。

有网友亲自下场向Grok 3提问,在面对下图中“比萨斜塔上两个球哪个先落下”这样常识性的问题时,Grok 3也仍然无法应对,因此被戏称为“天才不愿意回答简单问题”。

图源:x(谷歌翻译)

尽管如此,马斯克称未来他们将会进一步加大数据中心的建设力度,xAI的下一个计算集群会成为世界上最强大的集群,能耗达到1.2GW,相当于数十万户家庭1年的用电量。

网友犀利的评价:“自DeepSeek-R1之后,我们只应考虑效率更高的进步,而不仅仅那些规模更大、且比竞争对手耗能更多的进步。”

02、开源:一个“挤牙膏”,一个全开放

一般情况下,企业依靠高算力而堆出来的高性能模型,会基于成本考虑选择闭源或延迟开源。

关于Grok-3,马斯克并未当场宣布开源,而是表示:“当下一个版本完全发布时,将开源Grok的上一个版本,也就是当Grok-3成熟稳定时,我们将开源Grok-2。”

2月20日,马斯克转发xAI的推文,宣布短期内Grok 3.0向所有人免费开放。不出意外,Grok-3会延续“基础版开源+高级功能付费”的策略。这样既能吸引开发者贡献算力(社区训练反哺主模型),又能用开源生态倒逼竞争对手。

图源:x

而在刚刚过去的两周,以DeepSeek为中心的朋友圈迅速扩容。国外,有包括微软、英伟达、亚马逊等世界级云计算巨头;国内,三大基础运营商、超过15家芯片厂商,还有手机、车企、云服务、金融在内的200多家企业,多地政务服务系统,甚至两款“国民级应用”腾讯微信、百度搜索也先后宣布接入。

大模型到底应该开源,还是应该闭源?这个话题讨论已久,企业基本上走出三条路子:

  • 只做开源,没有盈利模式,只有大公司烧得起,Meta是少数走这条路的;
  • 开源闭源并行,比较灵活,既有收入又能获取用户,包括微软、谷歌、阿里云、腾讯云等,均践行这条路;
  • 只做闭源,相当于走了一条简单直接逻辑清晰的路,亚马逊、华为盘古、还有以前的文心一言(百度)、GPT-4(OpenAI)均如此。亚马逊、谷歌云在过去一年的营收增速都有所提升,这被认为是大模型拉动的结果。

在发展过程中,企业的观念也在发生变化。长期以来,OpenAI因为「不open」(不开放)而备受争议。OpenAI首席执行官萨姆·奥特曼曾为下一个模型的开源项目征集意见,“做一个相当小但仍需要在GPU上运行的o3-mini级模型,还是做一个我们能做得最好的适合手机运行的模型?”

就在看似闭源OpenAI遥遥领先之时,DeepSeek开源大模型的出圈又带来了巨大的不确定性。萨姆·奥特曼称OpenAI在开源AI软件方面“一直站在历史的错误一边”,他还透露,虽然并非所有员工都同意其观点,但OpenAI内部正讨论公开AI模型的权重等事宜。

开源或闭源,这其中掺杂了商业利益、技术观点等多重因素。Gartner高级分析师Mike Fang在接受DoNews采访时则表示,在人工智能大模型领域,开源和闭源的路线持续并存。

“如果闭源模型的性能不及开源模型,则其商业价值将受到质疑。然而,对于高性能的闭源模型,其商业路径仍然具备优势。未来AI大模型可能进入低算力、低成本时期,但高端模型仍会保持一定溢价。”

至于疯狂开源的DeepSeek,其发展模式是否会调整?未来盈利前景又将如何?在Mike Fang看来,这家公司短期不以盈利为目的,能够从研究角度鼓励工程师更高效运营,而没有特别多的财务变化或者业务变化的压力。未来如何能够保持初心,让发展模式或者技术创新能够持续下去,才是主要考虑的方向。

换个角度想,对于日活用户数量达数千万的DeepSeek来说,找到盈利模式并不困难,开源的价值要比想象中大得多。从某种层面来讲,DeepSeek的影响力是以往的技术突破无法比拟的——我们不应该只考虑它作为单个公司的科技价值、商业价值,而应该思考它对推动新质生产力发展的巨大价值。

03、面对DeepSeek的普及,企业要怎么做?

DeepSeek所代表的资源消耗更小、算法效率更高、推理更精确的技术路径,正在进一步助推AI应用成本下降。

从近期企业动作来看,不仅包括大语言模型领域积累较弱的手机、家电、PC、汽车厂商,就连已经开发出AI大模型的腾讯、360、百度等大厂,也在为自家的AI工具注入新动力。

但这会产生新的问题,所有人都接入了,等于所有人都没接。家家户户都有DeepSeek这把“金钥匙”,打开市场的、或者说驱动业务增长的核心差异化能力体现在哪里?在新的环境下,企业又该如何竞争?

关于这一点,Gartner的Mike Fang告诉我们,企业若仅满足于“简单接入”,就无法在竞争中脱颖而出。关键是要找到适合自身业务场景的AI解决方案,深度挖掘大模型的潜力,将其与行业特点、客户需求和特定场景紧密结合,并注重工程化落地与治理,从而实现高效且负责任的技术应用。

也就是说,大模型赋予产品强大的技术力,但如何将这一能力转化为无可替代的产品体验,让用户发自内心地接受使用,才是竞争的最终目标。

Mike Fang举例表示,当下,从车企到券商纷纷宣布接入DeepSeek,但也仅仅是接入,距离真实大规模应用落地还需要更长时间。“这其中涉及到模型切换,面对新的业务场景,企业要通过不断的流程测试以及在真实业务当中检验。 ”

但这里要注意数据问题,对于AI来说,有三大要素需要分析:大模型、算力和数据。在大模型迎来颠覆式创新之后,对算力的需求开始降低,下一个重要的瓶颈是数据。

通过Gartner研究表示,海外AI公司应用数据的能力较高,已经支持企业大模型的落地。反观国内,数据方面的数值一直徘徊在较低位,只有少部分企业能够实际把生成式AI应用从实验到最后的生产落地。

这就要考验企业是否具备构建一个从技术到市场的良性循环,不仅仅是关于产品的迭代与优化,更是如何在短期内通过市场数据和产品调整,不断提升大模型的能力。未来,谁能够获取专有数据,并能实现实时更新,将是竞争的关键所在。

单个企业是如此,而对于整个中国的AI产业来讲,DeepSeek还可以带动很多开发、推理,甚至是芯片方面的额外的机会,这将进一步加速企业“出海”。此外,AI接下来的治理也会变得更为重要,“如果把DeepSeek的能力比作高速行驶的一辆车,企业就需要自建或者管控出一个原生的刹车系统,这样才会使得大模型更健壮,‘车’能够开得更快。”Mike Fang表示。

可以说,DeepSeek搅动起的,早已不是AI大模型竞技规则变化的风云,而是影响多个产业迭代的深层变革浪潮。我们都站在了时代潮头,更需要以开放的心态拥抱变化。

相关内容

热门资讯

伦铜冲破14000美元大关!“... 文|财联社 受中国需求回升及供应风险加剧推动,伦铜价格周二一举跃升至每吨14,000美元以上,逼近...
“五一”体验经济观察:小手艺大... “五一”假期,体验经济发展带动服务消费火热。省文旅厅数据显示,5月1日至5日,全省60家重点景区累计...
4KMiles被收购后,亚马逊... 4KMiles被收购后 2026年上半年,跨境电商服务领域最受关注的交易之一,是飞书深诺集团对亚马逊...
原创 马... 国内能够成功预测行业趋势的人并不多,马云就是其中之一。早在2017年云栖大会、2020年达沃斯论坛等...
李彦宏提出AI时代进化论,“D... 5月13日至5月14日,Create2026百度AI开发者大会在京举办。百度创始人李彦宏在13日的开...
河南多地出现“不明飞行物”?洛... 5月12日晚8点左右,郑州、洛阳、开封、安阳、新乡、鹤壁等多地网友抬头发现,夜空中出现一团发光“水母...
原创 印... 在全球能源供给链面临重大挑战的当下,印度这个拥有13亿人口的国家,正在经历一场前所未有的能源危机。近...
A股收评:历史新高!创业板指、... 5月13日,A股三大指数低开高走,截至收盘,沪指涨0.67%报4242点创2015年7月以来新高,深...
拒绝短期逐利!西凤酒15年6年... 出品|中访网 审核|李晓燕 白酒行业潮起潮落,有人追风口赚快钱,有人沉下心做长期。西凤酒15年6年,...
订单已排到2028年!“超级心... 十年来,长江经济带“关、改、搬、转”近万家化工企业,沿江产业告别分散布局、低效竞争,向着集群化、高端...
港股异动丨协合新能源大涨近12... 协合新能源(0182.HK)今日大涨11.9%,报0.47港元,成交额接近4000万港元,总市值超3...
反超三星SDS 现代AutoE... 【CNMO科技消息】5月13日,据外媒报道,现代AutoEver近日超越三星SDS和LG CNS,成...
昆仑芯交付多个万卡智算集群,2... 国产AI芯片厂商昆仑芯之际,背后控股股东百度披露多项昆仑芯的商业化进展。 在5月13日的Create...
新质生产力赋能,力争把握科技机... 文|博望财经 来源|博望财经 在全球科技革命和产业变革加速演进的大背景下,中国硬科技产业正迎来黄金发...
自营业务撑起上市券商“腰包” 来源:滚动播报 (来源:千龙网) 券商自营,又撑满了券商的腰包。 券商中国记者统计,上市券商自营业务...
5个工作日,300万到账!蔡甸... 近日,汉口银行蔡甸支行依托知识价值信用贷产品优势,为湖北菜小饱信息科技有限公司高效办结300万元信贷...
原创 曾... 随着时代的飞速发展,我们的生活被智能手机、电脑以及日渐扩张的大城市所包围,但最贴近我们日常的,却往往...
虎牙2026年第一季度收入同比... 本报讯 (记者李豪悦) 5月12日,虎牙公司(以下简称“虎牙”)公布2026年第一季度财报。财报显示...
5月13日投资避雷针:美股光通... 导读:财联社5月13日投资避雷针,近日A股及海外市场潜在风险事件如下。国内经济信息方面包括:1)本周...
聚力苏州 广药集团招商迎来新机... 上证报中国证券网讯(记者 高志刚)5月12日,以“广聚势能 共筑荣药”为主题的广药集团·广药白云山市...