面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线 面壁智能前景 面壁智能怎么样
admin
2024-02-03 16:42:01
0

文 | 周鑫雨

编辑 | 邓咏仪

当大模型加速应用落地,运行成本就成为各厂商的现实考量。

将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。

“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源模型用7B的参数规模,在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。

这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。

对标Mistral,面壁智能发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。

为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,和云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。

在终端硬件厂商加速产品AI化的趋势下,面壁智能认为,成本是大模型的隐形竞争力,“比起size,我们更在意成本”。

以搭载了骁龙855芯片的OPPO手机为例,MiniCPM每秒能处理7.5 Tokens,运行5年后报废,成本为600元,由此可得170万Tokens的推理成本仅1元——MiniCPM的推理成本仅Mistral的1/100,GPT-4的1/360。

据介绍,目前MiniCPM-2B在CPU(比GPU计算吞吐量低)上就能跑起来,相较于用GPU才能运行的大模型,能够降低推理成本。与此同时,即便将大小压缩75%,MiniCPM的性能也能做到基本无损耗。

在性能上,MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B,而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM-2B的表现超过了Llama 2-70B-Chat。


MiniCPM-2B和Mistral-7B在主流评测集上的测评结果。图源:面壁智能


MiniCPM-2B和主流模型在MT-Bench上的测评结果。图源:面壁智能

就实际效果而言,MiniCPM-2B能够理解“中夹英”的多语言问题,并用法语作答;同时也能实现代码生成。


MiniCPM-2B的多语言交互。图源:面壁智能


MiniCPM-2B书写自身代码。图源:面壁智能

为了能够让MiniCPM以小博大,面壁智能主要在Infra、算法和数据三个层面,做了技术优化。

在Infra层面,基于集成了训练、推理、压缩、微调的全流程高效Infra,面壁智能能够将推理加速到10倍,将算力成本降低90%。

在算法层面,通过上千次的模型沙盒实验,面壁智能对模型批次大小、超参数配置等最优训练配置进行了探索。

在数据层面,用于MiniCPM的1T精选训练数据,来源于经过数据治理、多维评测的数据工厂。

为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。

通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模态问答。比如,MiniCPM-V可以识别毒蘑菇和毒蛇,并给出防护建议。模型响应速度接近7 Tokens/秒,几乎无延迟。


MiniCPM-V有关毒蘑菇的问答。图源:面壁智能


MiniCPM-V有关毒蛇的问答。图源:面壁智能

除了MiniCPM-V这款端侧多模态模型外,面壁智能对12B的多模态模型OmniLMM进行了开源(GitHub地址):https://github.com/OpenBMB/OmniLMM

相较于MiniCPM-V,OmniLMM不仅支持多模态对话,还支持多模态的实时交互,比如用户可以实时与模型进行石头剪刀布的游戏,也可以让模型实时识别路况。李大海介绍,未来OmniLMM的能力,也将逐步集成到MiniCPM-V上。


OmniLMM有关景点的问答。图源:面壁智能

目前,MiniCPM已经与国际主流手机机型和CPU进行了配置测试。当然,将模型接入终端设备,依然有不少问题亟待解决。

比如接入后,模型是否还能在端侧进行自主学习和迭代?面壁认为,通过高效参数微调技术,目前MiniCPM能在手机夜间充电时段,基于用户人机交互产生的数据知识和信息进行自主微调,但效果仍有待提高。

再比如,模型如何与搭载不同芯片的硬件进行一对一的适配?除了不断推动行业标准的建立,面壁认为目前可行的解法是开源,从而让开发者自行做适配的尝试。目前,MiniCPM也上线GitHub(内含技术报告):https://github.com/OpenBMB/MiniCPM

无论是端侧模型的自我迭代能力,还是软硬件适配的标准建立,大模型想要进入端侧,仍需要全产业链的推动。

欢迎交流!

相关内容

热门资讯

视频号广告服务企业梳理:工业制... 导语:根据《2025-2026中国短视频与直播营销白皮书》及多家第三方机构数据,视频号广告服务市场近...
原创 黄... 黄金这一跌,把两类人同时照了出来:一类是嘴上喊着“回调就买”的围观者,另一类是把客户定金当筹码的黄金...
半导体大牛股,紧急发布澄清声明 【导读】富信科技发布澄清公告 中国基金报记者 莫琳 6月28日,针对部分网络媒体、自媒体及社交媒体平...
脑佳科技CEO蒲云海:在真实场... 封面新闻记者 欧阳宏宇 无需开刀,靠意念就能操控机械手……近年来,脑机接口正逐步走进医疗领域,尤其是...
原创 6... 中国并没有选择让伊朗拖垮美国,这背后的算盘比表面复杂得多。 很多人以为中国是在“帮美国解围”,但其实...
三条全球最大碳纤维产线同日投产... 来源:第一财经 我国碳纤维产业创新发展再添里程碑。 6月28日,中国建材三条世界级高性能碳纤维生产线...
天津名酒回收行业观察:打破单一... 提起名酒回收,绝大多数人的固有认知,还停留在单一回收茅台、五粮液等国产高端白酒的传统模式。 过去很长...
东莞松山湖科技金融集聚区正式开... 6月25日上午,东莞松山湖科技金融集聚区开园仪式在集聚区金融广场举行。活动现场八大合作平台集中揭牌、...
携手华为“鸿图”打造智慧医院“... 在数字化浪潮奔涌的今天,一部手机控制全屋智能已不稀奇,但在关乎生命健康的医院里,让成千上万的医疗设备...
蜜雪冰城的玩法,口子窖能复制吗... 文 | 创业最前线 “麻雀也能喝二两”这句在安徽淮北濉溪县街头巷尾流传的俗语,最近被口子窖写成了一...
必迈体育冲击IPO,实控人、董... 曾任职李宁CEO的张志勇,如今带领旗下跑步运动垂类品牌“必迈”的运营主体北京必迈体育股份有限公司(以...
OpenAI推迟上市,那“Ki... 来源:虎嗅APP AI的估值逻辑变了,“Kimi们”准备好了吗? 出品|虎嗅科技组 作者|宋思杭 ...
又有城商行获批入股农商行 6月26日,宁夏金融监管局发布的行政许可信息显示,同意宁夏银行股份有限公司受让江苏汇金控股集团有限公...
中国建材三条世界级高性能碳纤维... 6月28日,据中国建材集团消息,中国建材三条世界级高性能碳纤维生产线在中复神鹰连云港基地集中投产,覆...
原创 6... 2026年的上半年,眼瞅着就要翻篇了。这半年,咱们普通人的日子过得有甜也有苦。菜价稳得住,工资单上的...
股价三连板!000823,紧急... 股价连续三个交易日涨停后,6月28日晚间超声电子(000823)发布了股票交易异常波动公告。 超声...
原创 人... 文 | 壹派 编辑 | 壹派 全国人口格局正在迎来彻底洗牌,新一轮定向迁徙浪潮早已悄悄拉开帷幕。 2...
原创 黄... 6月24日那天,盘面上的数字让不少人盯着屏幕发愣。国际现货黄金跌穿了4000美元。 高点还在5626...
原创 帮... 老铁们,下周开盘前先把这俩日子钉日历上:美国6月非农下周四出(因下周五独立日休市,比平时早一天),7...
日媒紧盯:中国关键金属进口量飙... 【文/观察者网 王恺雯】 为维护国家安全和利益、履行防扩散等国际义务,中方于今年1月宣布加强两用物项...