正面硬刚Gemini 3 Pro,阿里开源Qwen3.5-Plus|甲子光年
创始人
2026-02-16 23:52:38
0

17B激活参数“掀翻”万亿参数的牌桌。

作者|栗子

216日,除夕,阿里巴巴正式开源全新一代基座大模型千问Qwen3.5-Plus旗舰模型Qwen3.5-397B-A17B)。

Qwen3.5-Plus不仅在性能指标上正面硬刚谷歌Gemini 3 ProOpenAI GPT-5.2,更凭借一系列破坏性的技术指标重塑了全球开源生态的天花板。

这款模型在架构上实现了“以小胜大”的极致平衡:拥有3970亿总参数,单次推理却仅需激活170亿参数,其性能不仅持平甚至超越了此前万亿规模的Qwen3-Max;在商业维度上,其API价格被直接压低至Gemini 3 Pro1/18

更具代际意义的是,Qwen3.5完成了从“文本挂载视觉”向“原生多模态”的范式跃迁。这不再是一个单纯的对话框,而是一个能够深度理解物理世界、自主操作GUI并驱动真实商业订单流转的智能体底座。

Qwen3.5-Plus的开源,实际上是向全球开发者发放了一份通往智能体时代的低门槛门票。当顶级智能的获取成本降至冰点,原生多模态能力不再是巨头专利,一场关于效率、普惠与生态主权的深度博弈已然在2026年的春节期间拉开序幕。

1.告别“暴力美学”,迈向极致稀疏

长久以来,大模型产业一直笼罩在Transformer经典架构的“算力咒语”之下。

传统的自注意力机制具有二次方复杂度,这意味着计算资源消耗随文本长度增加而急剧膨胀,导致超长上下文处理成为少数巨头才能负担的奢侈品。

Qwen3.5-Plus的技术核心,在于其对这一底层范式的改良。通过将线性注意力机制与稀疏混合专家模型深度融合,千问团队在模型架构上实现了效率跨越,终结了“暴力堆砌参数”的时代。

与前代Qwen3-Max(万亿参数)相比,Qwen3.5-Plus总参数为3970亿,但通过自研的门控技术与稀疏混合专家(MoE)架构的结合,仅激活170亿参数,远低于传统稠密模型的100%参数激活率。

这种高效的参数激活机制带来了三大关键优势:

1.显存占用显著降低:Qwen3.5-Plus的部署显存占用较Qwen3-Max降低60%,极大降低了模型部署的硬件门槛。

2.推理效率大幅提升:在常用的32K上下文场景中,Qwen3.5-Plus的推理吞吐量可提升至Qwen3-Max8.6倍;在256K超长上下文情况下,推理吞吐量最大提升至19倍。

3.训练稳定性增强:通过门控技术解决了大模型长期存在的两大问题:注意力池(Attention Sink)和巨量激活(Massive Activation),使模型在低精度(如BF16)训练中更稳定,首token的注意力占比从46.7%降至4.8%,最大激活值从1053降至94

Qwen3.5-Plus的混合架构设计融合了线性注意力机制与稀疏MoE架构,实现了对长文本的动态聚焦。

传统大模型处理长文本时,每个token需与所有上下文进行全量注意力计算,而Qwen3.5-Plus通过动态分配注意力资源,对重要信息精读、对次要信息略读,显著降低了计算复杂度。

此外,Qwen3.5-Plus进一步强化了“思维模式”与“非思维模式”的二元体系。在处理日常对话或低难度任务时,模型可以利用非思维模式实现毫秒级的快速响应;而一旦涉及科研级问题或复杂的代码重构,模型会自动切换至长链条思维模式,通过生成内部思考链来提升答案的准确性。

用户甚至可以根据任务性质动态分配“思维预算”,这种灵活的计算资源调度机制,使得AI不再是一个死板的函数转换器,而更像是一个具备策略意识的智能实体。

这种对思维深度的精细化控制,是Qwen3.5-Plus能够以17B激活参数抗衡万亿模型的核心技术屏障让其在保持强大性能的同时,显著降低了计算资源需求,为大模型的普惠化应用奠定了基础,这也是其与Qwen3-Max最本质的区别。

2.原生多模态驱动的“行动革命”

如果说架构创新是Qwen3.5-Plus的骨架,那么原生多模态能力则是其具备执行力的灵魂。

过去的多模态模型大多采用“挂接”方式,即在文本模型的基础上通过适配器挂载一个视觉编码器。

这种方案虽然简单,但在处理复杂任务时往往会因为模态间的损失而产生逻辑断裂。

Qwen3.5-Plus实现了从预训练阶段就开始的深度融合,它不再是先将图片转成特征再喂给语言模型,而是在视觉与文本混合Token上直接进行预训练。这种原生设计,让大模型真正张开了“眼睛”,学会了密集的世界知识与空间物理逻辑。

在实际应用场景中,这种原生多模态能力转化为了强大的生产力。

例如,用户只需一张手绘的界面草图,Qwen3.5-Plus就能将其直接转化为可运行的前端代码;或者通过分析一张UI截图,就能精准定位并提供代码层面的修复建议。

这种从“感知”到“决策”再到“执行”的完整链路,正是通往通用人工智能的关键一步。它标志着大模型已不再满足于纸上谈兵,而是开始具备了真实世界的干预能力。

同时,视频理解能力同样经历了质的飞跃。支持长达2小时的视频直接输入,适用于长视频内容分析与摘要生成

在针对复杂物理空间推理的评测中,千问展现出了超越专用视觉模型的精细度。无论是在学科解题中的几何作图,还是在任务规划中的物理干预,模型都表现出了一种对三维世界深刻的直觉。

这种能力使得Qwen3.5-Plus在具身智能领域极具潜力,能够为未来的工业机器人或家用助理提供顶层的感知决策核心

3.全球AI天平的倾斜

当我们将目光从技术细节转回宏观商业领域Qwen3.5-Plus所引发的震动甚至更具颠覆性。

首当其冲的是其极具侵略性的定价策略:API调用价格每百万Token低至0.8元人民币,仅为Gemini 3 Pro1/18

甲子光年看来,这种“智能廉价化”将彻底洗牌全球AI市场的权力结构。

目前,千问大模型在全球范围内的开源生态影响力已经达到了一个前所未有的高度。阿里的开源模型数量已超过400个,覆盖全尺寸、全模态,其全球下载量突破10亿次大关。

一个值得玩味的细节是,开发者基于千问开发的衍生模型超过20万个,这构成了全球最厚实、最活跃的开源底座。这种生态的广度,让Qwen不再仅仅是一个模型产品,而是一个全球开发者共同维护、共同进化的智能基础设施。

此外,Qwen3.5-Plus在语言覆盖上的野心同样不容忽视。它将支持的语言与方言扩展到了201种,并将词表大小从15万扩容至25万。这一举措极大提升了非洲、南亚以及中国少数民族语言等低资源语种的编码效率,提升幅度高达60%

在全球化竞争中,这种对长尾语言的深度渗透,不仅体现了技术普惠的价值观,更是在这些新兴市场预先埋下了生态的种子。对于追求本地化、可定制AI解决方案的企业而言,具备这种跨语言、跨文化敏锐度的开源底座,显然比高高在上的闭源API更具吸引力。

这种全球AI天平的倾斜,标志着从“参数竞赛”向“架构效能竞赛”的转型已成定局。Qwen3.5-Plus用实际行动诠释了,未来的全球AI领导力将取决于谁能提供更低成本、更高透明度以及更强协同性的智能资源。

Qwen3.5-Plus的发布,我们可以清晰地看到阿里巴巴在AGI征途上的战略锚点。

它通过线性注意力的架构革命,打破了万亿参数模型的算力诅咒;通过原生多模态架构,赋予了AI真实世界的行动力;最后通过极致的性价比与开源生态,彻底重构了全球AI的经济生态

对于整个行业而言,Qwen3.5-Plus确立了2026年开源模型的新基准。

它告诉我们,通往AGI的道路并不只有闭源的一条路。开源模型不仅可以做追赶者,更可以做领航员。它不仅缩短了实验室原型与工业生产力之间的距离,更让“智能”这种宝贵的生产要素像水和电一样,变得唾手可得。

随着更多补丁的发布与社区生态的不断适配,Qwen3.5-Plus极有可能在接下来的几个季度内,成为全球范围内企业级本地化部署的首选底座。

阿里巴巴在2026年除夕的这一举措,既是一份给全球技术社区的新春贺礼,也是对大模型未来演进方向的一次深刻宣告。

未来的智能将不再是少数巨头构建的垄断孤岛,而是低成本、高性能、高度透明且全人类共享的普惠资源。

在这场奔向AGI的马拉松中,Qwen3.5-Plus已经率先跨过了那个关键的里程碑,而属于开源智能的黄金时代,才刚刚揭开序幕。

相关内容

热门资讯

哈易购APP非法期货交易欺骗投...   哈易购APP宣传可做白银铂金贵金属订购交易,但实际上并没有取得相关交易资质!哈易购APP本质上就...
消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...
澳大利亚审慎监管局拟放宽银行风... 澳大利亚审慎监管局(APRA)6月29日就修改 银行信用风险资本设定公开征求意见,旨在加大信贷投放以...