今年4月,DeepSeek突然传出要融资的消息。这事搁一年前,没人敢信。
梁文峰从2023年创立DeepSeek开始就一条铁律挂嘴边:不要外面的钱。结果今年春天,他居然自己把门推开了。
更离谱的是,阿里、腾讯两大巨头同时扑上来,估值从100亿美元一路飙到450亿美元。风头正劲的时候,谈判直接崩了。
4月22日,路透社爆出消息,说腾讯和阿里正在跟DeepSeek谈投资,目标估值超过200亿美元。
这条新闻一出来,整个AI圈都炸了。要知道DeepSeek之前连一分钱外部融资都没接过,属于中国AI赛道里最"清高"的公司。
梁文峰突然松口,背后到底出了什么事?两周不到,局势急转直下。
5月8日,有媒体说阿里和DeepSeek谈崩了。
紧接着腾讯那边也传出消息,提出收购最多20%股份的方案,被梁文峰婉拒。两家互联网巨头,一前一后吃了闭门羹。
这笔原本可能创下中国AI融资纪录的大交易,就这么黄了。阿里为什么被拒?这得从阿里的投资风格说起。
阿里这两年在AI领域大举布局,三年投3800亿搞AI基建,从算力到模型到应用全链条都要抓在手里。它投了月之暗面、智谱AI、MiniMax,每笔投资都有一个共同点——你得跟我的生态绑到一起。
用我的云,接我的数据,进我的体系。这套玩法在商业上完全说得通。但梁文峰偏偏不吃这一套。
DeepSeek追求的是技术路线上的独立性。你让它接入阿里的生态,等于把研发方向跟别人的商业需求捆在一起。
对一家把"自由做研究"当成命根子的公司来说,这比不融资还难受。阿里想要闭环,梁文峰想要自由,这两样东西放在同一张谈判桌上,注定谈不到一块去。
腾讯这边的情况又不一样。腾讯开的条件很直接——要拿20%的股份。这个比例看着不算大,但在公司治理层面上很有讲究。
20%的持股在重大事项表决中已经是一个很有分量的筹码,足以影响公司的战略方向。马化腾今年3月在业绩会上讲过"养虾"策略,意思是腾讯不怕晚,就怕投不准。
DeepSeek显然是他眼里的好标的。腾讯在AI上砸钱也不手软。2025年AI投入达到180亿元,光第四季度就花了70亿。
2026年资本开支还要翻倍。腾讯想通过持股DeepSeek来补齐大模型这块短板,出发点没毛病。
但梁文峰看得很清楚,20%的股份一旦出手,将来董事会格局就可能被改写。对他来说,方向盘必须自己握着,谁都不能碰。
就在融资谈判启动之后,4月27日,DeepSeek完成了一轮股权调整。
梁文峰的直接持股从1%跳到了34%,加上关联公司间接持有的部分,他实际控制的股权比例达到84.29%,表决权接近100%。这步棋的时间踩得非常准——先把控制权锁死,再跟人谈钱。
来者是客,但家还是我的。那梁文峰拒绝巨头的底气到底在哪?一个字:钱。
但不是融资的钱,是他自己口袋里的钱。幻方量化是他2015年创立的量化私募,2025年在700亿元管理规模上跑出了56.55%的年化收益。
光业绩提成这一项,估算下来一年能产生超过7亿美元的现金流。梁文峰几年前就不再对外募资,利润全部灌进DeepSeek的研发。
靠着幻方这台"提款机",DeepSeek三年来一直没有外部股东,没有对赌条款,没有商业化时间表的压力。这种状态在全球AI公司里几乎找不到第二家。
OpenAI背后站着微软,Anthropic依赖亚马逊和谷歌,国内的月之暗面半年融了四轮。只有DeepSeek,一个人扛着一家公司,走了三年。
那他现在为什么又要融资了?答案是两个现实问题逼到跟前了:算力不够,人留不住。
先说算力。DeepSeek V4确实在效率上做了很大优化,Pro版单token的算力消耗只有前一代的27%,KV缓存降到了十分之一。但问题是,大模型竞赛的规模在膨胀,算力卡的价格在涨,光靠省是省不出未来的。
2026年一季度,中美两边的高端算力资源都越来越紧缺。幻方一家的利润,已经快扛不住了。
人才流失的问题更扎心。过去一段时间,DeepSeek好几位核心研究员被大厂挖走。最受关注的是郭达雅,DeepSeek-R1的核心成员,跳到了字节跳动Seed团队。
罗福莉去了小米负责MiMo项目。大厂开出的条件有多夸张?Meta给顶尖AI人才的合同包,四年下来能到2亿到3亿美元。
在这种挖角力度面前,光靠情怀真的撑不了太久。所以这轮融资的真正目的,不是拿钱花,是给公司"标价"。
DeepSeek没有上市计划,员工手里的期权值多少钱,以前完全没有参照。有了这次融资确定一个估值锚点,期权就有了明确的价值。
对那些被大厂天价offer诱惑的年轻研究员来说,这至少是一份能看得见的承诺。梁文峰自己也说过,融资不是因为缺钱,是需要一个估值来兑现员工的期权价值。
阿里、腾讯都进不来,谁能进?5月6日,英国《金融时报》报道,国家集成电路产业投资基金正在洽谈领投DeepSeek首轮融资,估值约450亿美元。
这个消息释放的信号很明确——国家队下场了。国家大基金第三期2024年成立,注册资本3440亿元,以前主要投芯片制造和半导体产业链上的公司,从来没有公开投过大模型企业。
这次破例,说明在决策层眼里,DeepSeek这样的顶尖AI公司已经跟芯片一样,属于战略级资产。对梁文峰来说,大基金几乎是最理想的投资人。
国资背景意味着信用和资源,但不会像互联网大厂那样要求绑定生态、安排董事、干预技术方向。条件宽松,不绑手脚——这正好是梁文峰心目中"好投资人"的全部标准。
钱他不缺,他缺的是一个不会来抢方向盘的副驾驶。
这笔交易还有一层更深的意义。DeepSeek V4已经开始针对华为昇腾950PR芯片做推理优化,华为AI芯片今年在国内的销量已经超过英伟达。大基金投DeepSeek,等于在推动"国产模型配国产芯片"的组合落地。
美国那边还在持续收紧先进芯片出口管制,这个组合的战略分量不用多说。我们拉远一点看全球。
OpenAI今年3月以8520亿美元估值完成了1220亿美元融资,Anthropic的Claude模型估值也到了3800亿美元。
DeepSeek的450亿美元放在这些数字旁边好像不算什么,但要注意一件事——DeepSeek的模型全部开源,API定价低到离谱,V4-Flash版每百万token才两毛钱。它走的是一条完全不同的路,不能拿传统的商业估值逻辑去套。
再看国内。就在DeepSeek和阿里谈崩的同一周,月之暗面完成了约20亿美元新融资,估值冲到了200亿美元,半年内累计融超39亿美元。
月之暗面的路子是标准的互联网打法——快融资、快迭代、拿增长换估值。DeepSeek完全相反:不追速度,不抢窗口,埋头把模型效率做到极致,做完全部开源。
两条路各有风险,谁对谁错,这个答案得交给时间。梁文峰这个人挺有意思。广东湛江人,教师家庭出身,浙大读的硕士。
2015年干量化,几年做到国内顶流。赚够了钱之后转身扎进AGI研究。他不搞KPI考核,不鼓励加班,公司大部分人晚上七点就下班。
他说过一句话:一个人每天能高质量工作的时间很难超过六到八个小时,加班疲劳下做出的判断反而浪费算力资源。这话放在今天996横行的科技圈里,真的挺另类。
这场融资风波到现在还没完全落定,但方向基本清楚了。梁文峰把阿里和腾讯推出了门外,换来的是一个不会干涉他研发节奏的国资股东。
他自己出200亿占融资额的40%,控股权和表决权都牢牢攥在手里。他开了门,但规矩还是他定的。
我们作为旁观者,可能很难完全理解一个人把几百亿的"空白支票"往外推的心态。但从DeepSeek过去三年的轨迹来看,梁文峰守的不是钱,是一种稀缺的可能性——在资本主导一切的AI赛道里,还能不能有一家公司按自己的节奏做底层技术?
大基金的入场,某种程度上也是对这种可能性的一种肯定。接下来V4.1定在今年6月发布,到时候产品说话,比什么都有说服力。