马斯克惊呼太强了!国产0.8B模型开源,网友:已在iPhone上摩拳擦掌
创始人
2026-03-03 16:04:49
0

智东西

作者 | 李水青

编辑 | 心缘

智东西3月3日报道,昨日晚间,阿里开源4款Qwen3.5小尺寸模型系列:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B,可部署于笔记本电脑等端侧设备。

▲Qwen3.5社交平台X推文部分截图

模型一发布,不仅开发者圈讨论热烈,连马斯克也空降Qwen社交平台X推文下的评论区,他评价:“令人惊叹的智能密度。”自家Grok4.2发布在即,马斯克对中国大模型同行的关注度不减。

▲埃隆·马斯克在推文下的评论

在指令跟随、多语言、视觉推理等多项基准评测中,Qwen3.5-9B在GPQA Diamond、MMMU-Pro、ERQA、Video-MME等多项评测中拔得头筹,大幅领先GPT-OSS-20B、GPT-5 nano、Gemini 2.5 Flash-Lite以及自家的Qwen3-Next-80B-A3B-Thinking、Qwen3-30B-A3B-2507。

作为小型模型,Qwen3.5-4B的表现已接近Qwen3.5-9B,在多语言知识、视觉推理、文档理解等任务上媲美更大模型,在纯数学推理方面仍有差距,这也是小版本模型的普遍问题。

▲Qwen3.5-9B和Qwen3.5-4B的测评情况

这些小型模型均基于Qwen3.5统一基座,Apache 2.0开源可商用,支持LoRA/全量微调,消费级显卡即可启动任务适配。具体来看:

0.8B/2B版本具备小巧、快速的特点,是端侧首选。这两个模型非常适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。

4B版本性能更强劲,具备多模态基座模型。该版本适合作为轻量级智能体的核心大脑,平衡性能与资源消耗。

9B版本模型结构紧凑,但性能媲美gpt-oss-120B,适合需要较高智力水平但受限显存资源的服务器端部署,是性价比极高的通用模型选择。

目前所有模型均已在魔搭社区和Hugging Face开源,同时小尺寸模型的基座模型也已开源。

自2月中旬Qwen3.5模型正式推出之后,不少海内外开发者一直“催更”小规模版本Qwen3.5。而随着今天小版本模型终于面世,开发者们也立即参与讨论并体验起来。

一位开发者称:“9B在MMMU-Pro测试中以13分的优势击败GPT-5-Nano才是真正的亮点。一个可以在笔记本电脑上运行的模型,性能却超越了云端旗舰级的Nano模型,架构优势远胜于参数数量。”

▲社交平台X网友评论

另一位开发者称:“这比人们想象的要强大得多。一台运行在Mac mini 上的Qwen 3.5加上24hx7全天候运行的OpenClaw,就能打造出一个成本不到一个月初级员工工资的AI员工。”

还有开发者分享,他使用AMD Ryzen AI Max+395处理器和 Q4_K_XL量化算法,并开启完整的256k上下文窗口,处理速度达到了约30个token/s。而且它只需要不到16GB的显存。对此他惊叹:“我的天!Qwen3.5-9B 的体积虽小,但性能却非常强劲:多语言处理能力出色,通用知识储备丰富,视觉输入处理能力也很强。”

▲社交平台X网友评论

值得一提的是,有网友称Qwen 3.5不仅可在任何笔记本电脑上运行,它还能在手机上运行。此话一出,不少人追问:“如何在iPhone上运行?”

▲社交平台X网友评论

不过也有开发者直截了当地说:“4B模型只是一个智能自动补全工具,而不是一个思考伙伴。GPQA Diamond(研究生水平推理)的正确率约为45%,HMMT数学测试的正确率约为15%。这意味着它在难题上超过一半的概率都会出错。”

▲社交平台X网友评论

小型模型的能力固然有限,但其在特定能力维度评测上已达到Gemini 3 Flash等云端部署模型的水平,这意味着其已经能在很多端边侧场景发挥实际效用。

至此,Qwen3.5家族已开源:

1个大尺寸模型:Qwen3.5-397B-A17B

3个中型尺寸模型:Qwen3.5-122-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B

4个小尺寸模型:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B

Hugging Face地址:

https://huggingface.co/collections/Qwen/qwen35

魔搭社区地址:

https://modelscope.cn/collections/Qwen/Qwen35

附Qwen3.5-9B和Qwen3.5-4B完整测评成绩:

相关内容

热门资讯

霍尔木兹海峡局势扰动运价飙升,... 受航运板块走强带动,中远海发周二股价大幅拉升。港股方面,中远海发盘中一度涨超40%,创出近10年来新...
李志林:创新高后深V反弹,三桶... 创新高后深V反弹,三桶油银行股大涨 今日消息面: 【美股三大指数收盘涨跌不一】隔夜美股三大指数收盘涨...
马斯克身家8390亿美元!断层... 2026年3月2日,福布斯发布2026年3月全球十大富豪榜单,再一次见证历史。 埃隆·马斯克以839...
成都青羊区4大消费项目入选市级... 每日经济新闻 钟坤靓 每经编辑|赵博渊 宽窄巷子 图片来源:成都市青羊区提供 日前,成都市商务局...
“全民拼购”叠加“我店模式”:... 最近,商业圈里讨论最多的,莫过于“我店模式+全民拼购”这对新组合。短短几个月,这套玩法已在全国遍地开...
羽毛球品牌集体降价,去年曾三度... 图片来源:图虫 不少羽毛球爱好者近日发现,持续走高的羽毛球价格迎来理性回归,威克多、亚狮龙等多个主流...
马斯克惊呼太强了!国产0.8B... 智东西 作者 | 李水青 编辑 | 心缘 智东西3月3日报道,昨日晚间,阿里开源4款Qwen3.5小...
【IPO追踪】MiniMax的... 2026年1月初,中国AI大模型独角兽MiniMax(00100.HK)(稀宇科技)正式在港交所(0...
但斌:最关键的是提升A股公司盈... 近日,东方港湾董事长但斌在一场访谈中表示,英伟达股价虽然持续上涨,但估值仅有20倍甚至更低——因为利...
突然,熔断!暴跌超1400点!... 日韩股市遭遇猛烈抛售。 受中东紧张局势持续升级影响,日韩股市周二全线重挫,其中,韩国综合指数一度暴跌...
深耕技术与生态 孙宇晨2026... 2026年开年以来,波场TRON创始人孙宇晨动作频频,围绕AI与区块链融合、行业基础设施升级、公益创...
2025胡润中国500强榜单发... 瑞财经 王敏 2月5日,胡润研究院发布《2025胡润中国500强》,列出了中国500强非国有企业,按...
2026年中国气密性捡漏仪器行... 华经产业研究院为助力企业、科研、投资机构等单位了解气密性捡漏仪器行业发展态势及未来趋势,特重磅推出《...
有色金属震荡下挫 盛和资源、锡... 3月3日,有色金属震荡下挫,截至发稿,盛和资源(600392.SH)、锡业股份(000960.SZ)...
罕见!遭资金爆炒南方原油LOF... 上交所午间出手,遭资金爆炒的南方原油证券投资基金停牌! 3月3日在午间休市时段,上交所罕见发出了一份...
银行板块盘中逆势走强,银行ET... 3月3日,三大股指午后持续下行,而银行板块逆势拉升。截至下午14:00,银行ETF南方(159352...
这家国有大行,发力! 【导读】最火赛道又有新力军加盟!中国银行推出“慧投计划”,切入公募FOF赛道 中国基金报记者 方丽 ...
对赌失败后对薄公堂,A股公司上... 一次对赌失败,这家国内户外用品知名上市企业将控股子公司告上法庭,上演“母告子”剧情,寻求巨额业绩对赌...
原创 王... 当下的国剧市场中,年代剧如潮水般涌现,但总有一些作品能够脱颖而出,凭借着出色的口碑迅速走红。《纯真年...