独家 | 国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok 马斯克ai大模型grok开源昆仑万维 moe模型开源
admin
2024-04-02 09:42:36
0


马斯克宣布开源大模型Grok后,国内也将迎来首个开源的千亿参数MoE(混合专家)大模型。近日,「市界」独家获悉,国内独角兽企业APUS(麒麟合盛)联合新旦智能训练的大模型APUS-xDAN 大模型4.0(MoE)将于近日宣布开源。


据「市界」了解,APUS-xDAN 大模型4.0(MoE)是国内首个千亿以上参数MoE架构的开源大模型,参数规模为1360亿,这也是目前国内参数规模最大的开源模型。此前国内开源的大模型中,参数规模最大的是阿里720亿参数的千问72B,参数规模为720亿。

此外,「市界」获悉,APUS-xDAN 大模型4.0(MoE)还是国内首个支持在4090低端算力上训练的千亿参数开源大模型,通过MoE架构和算法优化实现了对低端算力芯片的适配。

“马斯克的Grok至少要8张H100才能运行,大部分中小企业其实没有那么多资源,而4090是一个消费级显卡,成本比较低,在国内也更容易获得,大部分企业和机构都能用来训练。”APUS董事长兼CEO李涛对「市界」表示。

据《参考消息》报道,美国方面修订了五个月前出台的相关规定,旨在使中国更难进口美国的高端人工智能芯片。

针对这一现状,李涛和新旦智能创始人成一鹏均提到,对低端算力的支持,是这次APUS-xDAN大模型4.0(MoE)的最大突破,能够很大程度上应对算力卡脖子问题。

这次开源的APUS-xDAN大模型4.0(MoE)背后,站着两家企业,分别是成立十年的独角兽企业APUS和一家初创人工智能企业新旦智能,模型由双方共同训练,并且APUS投资了新旦智能。

资料显示,APUS是一家成立于2014年的人工智能企业,由360前副总裁李涛于2014年创办,2022年之前主要做出海业务。

2022年底开始,APUS正式转型人工智能和大模型,2023年4月,APUS正式发布了APUS通用大模型,据李涛向「市界」披露,目前APUS的大模型团队超过百人。李涛还提到,目前开源的APUS-xDAN大模型4.0(MoE)的综合性能已经可以实现GPT-4 的90%。


▲图源/APUS-xDAN 大模型4.0(MoE)

作为一家人工智能企业,李涛提到,APUS大模型的另一个优势是算法语料比较多元化,国内大模型玩家很多都依赖于中文语料进行训练,对于其他语言的算法语料覆盖远远不足。而APUS的产品和服务目前已经覆盖了全球200多个国家,用户数量达到24亿+,算法语料更加多元。

李涛表示,APUS目前为止是国内大模型行业商业化最好的企业之一,已经落地医疗、电商、网信大模型,除了To C领域以外,在ToG和ToB领域探索了多样化的应用场景。


而新旦智能目前成立不到一年时间,由成一鹏创立于2023年5月,成立后不久,就分别用7B、30B模型在大模型榜单MT-Bench上登顶TOP1。2024年3月初,新旦智能宣布完成千万级别天使轮融资,背后的投资方就是APUS和AI行业投资人周弘扬。

据新旦智能创始人成一鹏向「市界」介绍,目前新旦智能的团队规模为十余人,由一群来自清华、伯克利、腾讯、Meta等机构和企业的工程师组成,成员包括全球顶尖的开源AI社区知名开发者Wing (目前全球最受欢迎的AI训练系统作者), 以及开源社区最受欢迎的AI数据组织Founder Austin。

据成一鹏介绍,新旦智能的多模态智能体在LLM领域已经完成了对GPT3.5 Turbo的超越,很多指标和GPT4只有不到10%的差距,例如MMLU(74.7%)比较通用的推理分析指标, GSM 8K 数学指标(82.5%),差距大概只有 9%。然后在部分领域,他们已经超过了GPT4,例如智能体的这个拟人性指标(MT bench )已经超越GPT 4 约 3% 。

“可以简单理解为,我们现在拥有一个智商上正在逼近GPT4,同时情商还很高的大脑装配在了自己的智能体上。”成一鹏表示。

这次开源的APUS-xDAN大模型4.0(MoE)另一个突破点,是填补了国内千亿大模型在开源领域的空白,目前国内千亿规模以上的大模型基本都不开源,包括百度的文心一言、华为的盘古大模型等。而参数规模是衡量模型复杂度的重要指标,更大的参数往往可以让大模型在处理复杂任务时表现更好,具有更高的准确性和泛化能力。

作者 | 曾 广

编辑 | 董雨晴

运营 | 刘 珊

相关内容

热门资讯

原创 今... 今日为5月23日,国际现货黄金价格在4500美元/盎司整数关口附近徘徊不前,日内最低触及4480美元...
三连亏后变为“无主”状态,农尚... 从吴亮手中接盘农尚环境(300536)不足三年后,林峰如今让出了公司控制权,上市公司进入“无主”状态...
55岁湖南女首富出手!豪掷13... 快科技5月24日消息,与马斯克、库克并肩而坐,刚参加完国宴的湖南女首富周群飞就买了家上市企业。 近日...
外资加仓A股,岂是跟风这么简单... 熬过忙碌的交易日,在周末安静时段,理清接下来布局方向。本篇为大家准备了5条要闻,涵盖市场动态、行业变...
原创 俄... 在全球能源的残酷牌桌上,手里攥着石油,腰杆子才能硬气。长期以来,中东的沙漠、俄罗斯的冰原、美国的页岩...
喜力啤酒有产品将涨价,华润啤酒... 来源:红星新闻 红星资本局5月22日消息,今日,红星资本局从雪花啤酒(厦门)有限公司、华润啤酒方面获...
原创 金... 心理预期调整刻不容缓,五月二十二日,黄金价格或将重现十五年前的历史性低迷。 近期若您密切关注着黄金市...
原创 马... 埃隆·马斯克如果能让SpaceX实现“科幻小说”级别的目标,他可能获得1万亿美元的收入。 埃隆·马斯...
涨涨涨!放开限制、可加杠杆!这... 韩国股市站在风口上! 据最新消息,为吸引更多海外资金进入股市,韩国政府计划放开限制,允许境外投资者直...
下周9家上会丨科创板首单IPO... IPO及再融资上会预告 据交易所官网审核动态信息,下周(5.25-5.29)IPO上会审核6家企业,...
富途、老虎市值蒸发1/4!或被... 来源:金融时报 5月22日,中国证监会宣布依法对Tiger Brokers (NZ) Limited...
马爸爸的好兄弟钱多多搞了杀猪盘... *此图由AI生成 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro 上周四,港股经纬天地大崩盘...
原创 壳... 编辑:XL 国际能源圈最近炸开了锅,壳牌这家百年石油巨头在2026年3月与委内瑞拉政府正式签署多项油...
存储热潮愈演愈烈!奖金拿到手软... 财联社5月24日讯(编辑 卞纯)在席卷全球的存储芯片热潮中,韩国“存储芯片双雄”SK海力士和三星无疑...
揽牌、合作、生态,跨境支付头部... 近日,国内头部跨境支付机构密集落地海外重要布局,一方面,连连数字、PingPong两家公司相继在中东...
原创 帮... 老铁们,周末好!我是帮主郑重。刚扫了一眼下周的财经日历,好家伙,事件一个接一个,堪称“消息面轰炸周”...
海南省住建厅与中国石化海南石油... 5月22日,中国石化海南石油分公司代表、党委书记李新强、总经理蔡文东一行赴海南省住建厅拜访交流。省住...
原创 金... 2026年5月22日,国际黄金价格报4536.7美元/盎司,较前期高点5597美元回落约1100美元...
“双标”换卡背后,银行还需多些... 新华社记者 颜之宏、杨深深 持到期银行卡和身份证去银行网点换新卡,却被要求“必须交回旧卡才能取新卡”...
“离境退税2.0”带动“中国购... 【环球时报综合报道】编者的话:5月18日,商务部等6部门联合发布《关于加力优化离境退税措施扩大入境消...