华为云:CloudMatrix384突破大模型训推瓶颈,加速行业智能化跃迁
创始人
2025-06-24 20:54:31
0

6月21日,华为开发者大会2025期间,以“CloudMatrix384昇腾AI云服务,算力聚变加速行业AI创新”为主题的高峰论坛顺利举办,四位来自不同领域的AI先行者,与近200位开发者深度对话,从技术内核到场景落地,全面解析基于CloudMatrix384超节点的新一代昇腾AI云服务如何破解AI算力、运力、存力瓶颈,成为行业智能化跃迁的核心引擎。

高密、高速、高效,重建大模型时代的AI基础设施新标准

当前,AI大模型正以指数级速度进化,模型参数突破千亿、万亿级,传统算力架构的“算力墙”“通信墙”“存储墙”已成为制约行业创新的核心痛点。华为云公有云解决方案部CTO刘赫伟在峰会上指出:“大模型的爆发式发展,本质是对算力、运力、存力的全维度挑战。基于CloudMatrix384超节点的昇腾AI云服务,已成为突破算力、运力、存力瓶颈的AI基础设施新标准。”

CloudMatrix384昇腾AI云服务,通过“硬件重构+软件智能”的深度融合,打造出高密、高速、高效的AI-Native基础设施:

• 高密:超节点级联,构建“超级AI服务器”

CloudMatrix384昇腾AI云服务创新性地将384颗昇腾NPU与192颗鲲鹏CPU通过MatrixLink高速网络全对等互联,形成单节点“超级AI服务器”,更是支持432个超节点级联,构建最高16万卡的超大集群,彻底打破传统架构的规模限制,为大模型训练提供“无限算力池”。

• 高速:纳秒级通信,让算力“无损协同”

其核心网络架构MatrixLink通过亲和性调度、协议重构等技术突破,实现三大性能飞跃:卡间带宽高达2.8Tb/s,节点内通信时延降至纳秒级,节点间网络时延仅微秒级。配合PB级虚拟显存、跨节点/集群DRAM池等创新设计,KV Cache传输带宽提升10倍,输出每个Token的时延降至50ms,平均单卡吞吐量跃升到2300 Tokens/s。

• 高效:智能调度,释放算力“最大效能”

基于底层强大的算力、网络、存力,结合上层专家任务智能调度能力,CloudMatrix384昇腾AI云服务基于“一卡一专家、一卡一算子任务”的灵活分配、并行推理,将算力有效使用率(MFU)提升50%以上,同时结合昇腾云脑,实现全栈故障感知、诊断与快速自动恢复,彻底解决传统集群的训推难题。

华为半导体业务部战略与业务发展总监夏砚秋表示:“CloudMatrix384昇腾AI云服务把算力、网络、存储等硬优势与P/D分离、专家调度、算子优化等软实力深度协同,让千亿参数MOE模型的训推性能再上一个台阶。”以DeepSeek V3/R1为例,在较低时延下可实现2000 TPS以上的吞吐量,综合性能全面领先。

行业实践:从大模型到终端智能,多场景验证“算力聚变”价值

CloudMatrix384昇腾AI云服务的技术优势,已在各行业得到初步验证,此次大会上,不同领域的先行者分别展示了他们的案例成果。

硅基流动作为国内领先的大模型MaaS服务商,与华为云的合作由来已久,其政企商业化负责人吴凡在会上介绍,硅基流动早在5月就率先在CloudMatrix384昇腾AI云服务上部署DeepSeek-R1,基于大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现更高吞吐,用户20TPS前提下,单卡Decode吞吐突破1920 Tokens/s,比肩业界主流GPU的部署性能,硅基流动将继续基于CloudMatrix384昇腾AI云服务持续创新,与行业客户合作共同解决AI落地的各种重大难题。

小艺作为华为终端智能的核心入口,对推理平台的精度、时延、吞吐要求极高。华为计算产品线芯片应用专家卓恒在方案讲述时介绍:“CloudMatrix384超节点凭借其超大算力、带宽、专家并行部署规模,实现了极致的推理吞吐与时延,让小艺的交互体验得到全面提升”同时,将CloudMatrix384超节点与其它技术框架相结合,如与元戎Serverless框架结合,提升长序列推理场景能力,降低了TTFT、提升Prefill/Decode吞吐,与Mindspore结合,实现了EP通信极致覆盖、解决了EP专家负载不均的难题、降低了重计算损失,进一步提升了小艺的训练和推理效能。

此外,新浪基于CloudMatrix384昇腾AI云服务,让“智慧小浪”推理交付效率提升50%+,上线速度成倍加快;中科院基于CloudMatrix384昇腾AI云服务,自研模型训练框架,快速构建AI4S科研大模型;面壁智能基于CloudMatrix384昇腾AI云服务,实现小钢炮模型的推理业务性能大幅提升;科大讯飞基于CloudMatrix384昇腾Al云服务,助力讯飞星火大模型极致推理性能;360打造的“超级搜索”纳米A搜索,对AI算力有极大需求,也已开启了CloudMatrix384超节点的测试。

刘赫伟在会上总结到:“CloudMatrix384昇腾AI云服务将深度融入电商、社交、文娱、金融、汽车等行业的典型智能化场景,降低AI创新门槛,扩大AI创新成效,让更多企业与开发者享受技术的红利,加速全行业智能化跃迁。”

此次高峰论坛,不仅是一次技术成果的集中展示,更搭建了“技术-场景-生态”的深度交流平台,CloudMatrix384昇腾AI云服务在各行的逐步落地,也标志着AI基础设施正式进入“超节点时代”,而华为云正以开放姿态,携手客户、伙伴,共同书写行业智能化的新篇章。

相关内容

热门资讯

高位资产调整 红利板块走势活跃 10月14日,A股市场早盘高开,但随着芯片股等高位股的受阻回落,市场风格发生明显变化。科技股大幅调整...
ETF期权量化策略能赚钱吗? ETF期权量化策略能赚钱吗?ETF期权是交易所交易基金的一种衍生金融工具,其交易机制和股票、期货等投...
小红书舆情处理排行榜:TOP5... 别等负面笔记上热搜才行动!这份测评能救你的品牌 在小红书混,谁还没遇到过几条糟心的负面笔记?眼看着...
资金增持潮起 银行股迎久违普涨 10月14日,银行板块再度成为A股市场焦点。早盘42只银行股全线飘红,午后延续强势直至收盘,42家A...
万科原总裁祝九胜已被采取刑事强... 记者从多个信源获悉,万科A(000002.SZ)原总裁、CEO祝九胜已被采取刑事强制措施。 祝九胜在...
美联储10月降息预期高涨 10... 财联社10月15日讯(编辑 潇湘)在周一因哥伦布日假期休市一天后,美债收益率周二并未停下回落的脚步,...
汕头这块地,1.12亿成交 来源 | 城视汕头、大猫楼市 转载请注明来源 今早,珠港新城又成功拍出一宗商业用地。 地块位于珠池港...
黄金市场迎来“狂欢时刻”,银行... 本报(chinatimes.net.cn)记者卢梦雪 北京报道 10月14日,国际金价持续攀升并突破...
国际货币基金组织上调全球增长预... 当地时间2025年10月14日,美国华盛顿,国际货币基金组织首席经济学家皮埃尔-奥利维耶·古兰沙(左...
内蒙肉牛价格逆势增长近50%,... 内蒙古活牛价格从每公斤20元的低谷徘徊到2025年每公斤近30元的价值跃升,从全行业两年亏损到供不应...
原创 小... 一辆小米SU7在成都街头燃起的大火,烧灼着公众对电动汽车安全的信任。 小米汽车本想以“科技新贵”的姿...
事关降息、缩表!鲍威尔最新发声... 1 李强主持召开经济形势专家和企业家座谈会 中共中央政治局常委、国务院总理李强10月14日下午主持召...
通报!中银订购APP被骗经历!... 通报!中银订购APP被骗经历!被骗看过来!老师带单的真相被广告宣传给诱导,注册就送什么现金,然后充...
逆光!中国白银亏了可以要回吗?... 逆光!中国白银亏了可以要回吗?金融照妖镜:照一照你的期货平台是不是黑平台被广告宣传给诱导,注册就送什...
确凿!中银订购APP被骗怎么追... 确凿!中银订购APP被骗怎么追回损失?被骗看过来!平台跑路,投资者维权无门被广告宣传给诱导,注册就...
封神!华通白银是诈骗平台吗?骗... 封神!华通白银是诈骗平台吗?骗局大揭秘!亏损真相曝光!被广告宣传给诱导,注册就送什么现金,然后充值返...
确凿!祥瑞金业被骗怎么追回损失... 确凿!祥瑞金业被骗怎么追回损失?被骗看过来!资金流向不明被广告宣传给诱导,注册就送什么现金,然后充...
逆光!中国白银是真是假?现货平... 逆光!中国白银是真是假?现货平台非法开展期货交易?这是典型的诈骗行为被广告宣传给诱导,注册就送什么现...
通报!祥瑞金业被骗怎么办?被骗... 通报!祥瑞金业被骗怎么办?被骗看过来!虚假宣传与承诺被广告宣传给诱导,注册就送什么现金,然后充值返...
逆光!中国白银是真是假?骗局亏... 逆光!中国白银是真是假?骗局亏损大曝光!你的亏损早已注定!被广告宣传给诱导,注册就送什么现金,然后充...