正面硬刚Gemini 3 Pro,阿里开源Qwen3.5-Plus|甲子光年
创始人
2026-02-16 23:52:38
0

17B激活参数“掀翻”万亿参数的牌桌。

作者|栗子

216日,除夕,阿里巴巴正式开源全新一代基座大模型千问Qwen3.5-Plus旗舰模型Qwen3.5-397B-A17B)。

Qwen3.5-Plus不仅在性能指标上正面硬刚谷歌Gemini 3 ProOpenAI GPT-5.2,更凭借一系列破坏性的技术指标重塑了全球开源生态的天花板。

这款模型在架构上实现了“以小胜大”的极致平衡:拥有3970亿总参数,单次推理却仅需激活170亿参数,其性能不仅持平甚至超越了此前万亿规模的Qwen3-Max;在商业维度上,其API价格被直接压低至Gemini 3 Pro1/18

更具代际意义的是,Qwen3.5完成了从“文本挂载视觉”向“原生多模态”的范式跃迁。这不再是一个单纯的对话框,而是一个能够深度理解物理世界、自主操作GUI并驱动真实商业订单流转的智能体底座。

Qwen3.5-Plus的开源,实际上是向全球开发者发放了一份通往智能体时代的低门槛门票。当顶级智能的获取成本降至冰点,原生多模态能力不再是巨头专利,一场关于效率、普惠与生态主权的深度博弈已然在2026年的春节期间拉开序幕。

1.告别“暴力美学”,迈向极致稀疏

长久以来,大模型产业一直笼罩在Transformer经典架构的“算力咒语”之下。

传统的自注意力机制具有二次方复杂度,这意味着计算资源消耗随文本长度增加而急剧膨胀,导致超长上下文处理成为少数巨头才能负担的奢侈品。

Qwen3.5-Plus的技术核心,在于其对这一底层范式的改良。通过将线性注意力机制与稀疏混合专家模型深度融合,千问团队在模型架构上实现了效率跨越,终结了“暴力堆砌参数”的时代。

与前代Qwen3-Max(万亿参数)相比,Qwen3.5-Plus总参数为3970亿,但通过自研的门控技术与稀疏混合专家(MoE)架构的结合,仅激活170亿参数,远低于传统稠密模型的100%参数激活率。

这种高效的参数激活机制带来了三大关键优势:

1.显存占用显著降低:Qwen3.5-Plus的部署显存占用较Qwen3-Max降低60%,极大降低了模型部署的硬件门槛。

2.推理效率大幅提升:在常用的32K上下文场景中,Qwen3.5-Plus的推理吞吐量可提升至Qwen3-Max8.6倍;在256K超长上下文情况下,推理吞吐量最大提升至19倍。

3.训练稳定性增强:通过门控技术解决了大模型长期存在的两大问题:注意力池(Attention Sink)和巨量激活(Massive Activation),使模型在低精度(如BF16)训练中更稳定,首token的注意力占比从46.7%降至4.8%,最大激活值从1053降至94

Qwen3.5-Plus的混合架构设计融合了线性注意力机制与稀疏MoE架构,实现了对长文本的动态聚焦。

传统大模型处理长文本时,每个token需与所有上下文进行全量注意力计算,而Qwen3.5-Plus通过动态分配注意力资源,对重要信息精读、对次要信息略读,显著降低了计算复杂度。

此外,Qwen3.5-Plus进一步强化了“思维模式”与“非思维模式”的二元体系。在处理日常对话或低难度任务时,模型可以利用非思维模式实现毫秒级的快速响应;而一旦涉及科研级问题或复杂的代码重构,模型会自动切换至长链条思维模式,通过生成内部思考链来提升答案的准确性。

用户甚至可以根据任务性质动态分配“思维预算”,这种灵活的计算资源调度机制,使得AI不再是一个死板的函数转换器,而更像是一个具备策略意识的智能实体。

这种对思维深度的精细化控制,是Qwen3.5-Plus能够以17B激活参数抗衡万亿模型的核心技术屏障让其在保持强大性能的同时,显著降低了计算资源需求,为大模型的普惠化应用奠定了基础,这也是其与Qwen3-Max最本质的区别。

2.原生多模态驱动的“行动革命”

如果说架构创新是Qwen3.5-Plus的骨架,那么原生多模态能力则是其具备执行力的灵魂。

过去的多模态模型大多采用“挂接”方式,即在文本模型的基础上通过适配器挂载一个视觉编码器。

这种方案虽然简单,但在处理复杂任务时往往会因为模态间的损失而产生逻辑断裂。

Qwen3.5-Plus实现了从预训练阶段就开始的深度融合,它不再是先将图片转成特征再喂给语言模型,而是在视觉与文本混合Token上直接进行预训练。这种原生设计,让大模型真正张开了“眼睛”,学会了密集的世界知识与空间物理逻辑。

在实际应用场景中,这种原生多模态能力转化为了强大的生产力。

例如,用户只需一张手绘的界面草图,Qwen3.5-Plus就能将其直接转化为可运行的前端代码;或者通过分析一张UI截图,就能精准定位并提供代码层面的修复建议。

这种从“感知”到“决策”再到“执行”的完整链路,正是通往通用人工智能的关键一步。它标志着大模型已不再满足于纸上谈兵,而是开始具备了真实世界的干预能力。

同时,视频理解能力同样经历了质的飞跃。支持长达2小时的视频直接输入,适用于长视频内容分析与摘要生成

在针对复杂物理空间推理的评测中,千问展现出了超越专用视觉模型的精细度。无论是在学科解题中的几何作图,还是在任务规划中的物理干预,模型都表现出了一种对三维世界深刻的直觉。

这种能力使得Qwen3.5-Plus在具身智能领域极具潜力,能够为未来的工业机器人或家用助理提供顶层的感知决策核心

3.全球AI天平的倾斜

当我们将目光从技术细节转回宏观商业领域Qwen3.5-Plus所引发的震动甚至更具颠覆性。

首当其冲的是其极具侵略性的定价策略:API调用价格每百万Token低至0.8元人民币,仅为Gemini 3 Pro1/18

甲子光年看来,这种“智能廉价化”将彻底洗牌全球AI市场的权力结构。

目前,千问大模型在全球范围内的开源生态影响力已经达到了一个前所未有的高度。阿里的开源模型数量已超过400个,覆盖全尺寸、全模态,其全球下载量突破10亿次大关。

一个值得玩味的细节是,开发者基于千问开发的衍生模型超过20万个,这构成了全球最厚实、最活跃的开源底座。这种生态的广度,让Qwen不再仅仅是一个模型产品,而是一个全球开发者共同维护、共同进化的智能基础设施。

此外,Qwen3.5-Plus在语言覆盖上的野心同样不容忽视。它将支持的语言与方言扩展到了201种,并将词表大小从15万扩容至25万。这一举措极大提升了非洲、南亚以及中国少数民族语言等低资源语种的编码效率,提升幅度高达60%

在全球化竞争中,这种对长尾语言的深度渗透,不仅体现了技术普惠的价值观,更是在这些新兴市场预先埋下了生态的种子。对于追求本地化、可定制AI解决方案的企业而言,具备这种跨语言、跨文化敏锐度的开源底座,显然比高高在上的闭源API更具吸引力。

这种全球AI天平的倾斜,标志着从“参数竞赛”向“架构效能竞赛”的转型已成定局。Qwen3.5-Plus用实际行动诠释了,未来的全球AI领导力将取决于谁能提供更低成本、更高透明度以及更强协同性的智能资源。

Qwen3.5-Plus的发布,我们可以清晰地看到阿里巴巴在AGI征途上的战略锚点。

它通过线性注意力的架构革命,打破了万亿参数模型的算力诅咒;通过原生多模态架构,赋予了AI真实世界的行动力;最后通过极致的性价比与开源生态,彻底重构了全球AI的经济生态

对于整个行业而言,Qwen3.5-Plus确立了2026年开源模型的新基准。

它告诉我们,通往AGI的道路并不只有闭源的一条路。开源模型不仅可以做追赶者,更可以做领航员。它不仅缩短了实验室原型与工业生产力之间的距离,更让“智能”这种宝贵的生产要素像水和电一样,变得唾手可得。

随着更多补丁的发布与社区生态的不断适配,Qwen3.5-Plus极有可能在接下来的几个季度内,成为全球范围内企业级本地化部署的首选底座。

阿里巴巴在2026年除夕的这一举措,既是一份给全球技术社区的新春贺礼,也是对大模型未来演进方向的一次深刻宣告。

未来的智能将不再是少数巨头构建的垄断孤岛,而是低成本、高性能、高度透明且全人类共享的普惠资源。

在这场奔向AGI的马拉松中,Qwen3.5-Plus已经率先跨过了那个关键的里程碑,而属于开源智能的黄金时代,才刚刚揭开序幕。

相关内容

热门资讯

春晚,合作上市公司曝光!科技新... 导读:“四十余载春晚路,半部中国商业史。”回顾历届春晚合作伙伴,从八十年代的手表、自行车,到九十年代...
【财经早报】关于AI应用等,华... 重要新闻提示 四部门:加大农村地区企业上市辅导培育力度,帮助更多企业利用多层次资本市场进行融资 市场...
阿里发布新一代基模千问3.5,... 大象新闻记者 李莉 张迪驰 2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plu...
原创 德... “一年前,我们还对来自中国的热泵设备将信将疑。现在,我们的订单已经排到半年后了。”一位德国热泵经销商...
春节教养课:五句箴言,让孩子成... 每逢春节,本应温馨的团圆时刻,却常因孩子的行为失当蒙上阴影。知乎上“过年有哪些现象让你感到不悦?”的...
4.2亿关联项目:滨海能源子公... 来源:财中社 2月13日,滨海能源(000695)发布公告,控股子公司邢台旭阳新能源科技有限公司与旭...
逆差暴跌,美元信用要崩?美国人... 美国一直保持着巨大的逆差,而且已经几十年都如此。画一张图如下: 所以美国为什么常年如此?答曰这是与...
平安基金总经理肖宇鹏:持续提升... 一元复始,岁月展新。在马年春节到来之际,我谨代表平安基金恭祝各位投资者和合作伙伴新春快乐,万事顺意!...
原创 非... 联合国秘书长刚喊完话,中国对53个非洲国家的零关税政策就冲上热搜。别以为这只是国际新闻——你家超市的...
视频丨机器人手术与传统手术的对... 专访嘉宾: 刘合利 中南大学湘雅医院胃肠外科主任 医学博士 主任医师 博士研究生导师 Q:机器人手术...
当AI入驻春晚,红包、技术、场... 每经记者:毕媛媛 每经编辑:魏官红 "" 除夕夜,白酒广告还在,手机厂商也没有缺席。但和往年不同,今...
港股除夕交易日人工智能大爆发,... 极目新闻记者 吕少峰 爆竹声中一岁除,春风送暖入屠苏。丙午马年春节的脚步越来越近,港股也迎来了春节前...
除了自嗨锅,其他自热火锅品牌如... 来源:新浪财富汇 随着自嗨锅的破产清算成为行业收缩的缩影,自热火锅市场正经历深度调整,而颐海国际作为...
重阳投资董事长王庆:“四辩”股... 岁序更迭,骏马奔腾。值此丙午马年新春佳节来临之际,我谨代表上海重阳投资管理股份有限公司,向中国基金报...
龙建路桥股份有限公司 关于控股... 本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、...
原创 1... 曾几何时,高耸入云的高层住宅,无论是对于精打细算的开发商,还是追求生活品质的普通居民,都曾是令人心驰...
超级干货!谁在定义黄金的价格 人类最早发现黄金的历史,可以追溯到新石器时代晚期。截至目前,我们花了几千年的时间,总共收集了22万吨...
《求是》杂志编辑部:开局之年经... 开局之年经济工作怎么干 《求是》杂志编辑部 过去的2025年,面对国内外经济环境复杂变化,我国经济顶...
原创 中... 朋友们大家好!今天小界来和大家聊聊关于中国稀土的话题!七国联手发难,剑指中国稀土!美国、日本、英德法...
全线跳水,超11万人爆仓!金银... 加密货币全线跳水,黄金白银又跌了!2月16日,现货黄金、白银盘中再度下探。现货黄金盘中跌超1%,跌破...