法国版OpenAI杀疯了!1760亿参数MoE登开源榜首,3张A100显卡可跑,杨立昆转发“逆天”评论 法国版OpenAI杀疯了!1760亿参数MoE登开源榜首,3张A100显卡可跑,杨立昆转发“逆天”评论
admin
2024-04-11 11:33:06
0


智东西(公众号:zhidxcom
作者香草
编辑李水青

智东西4月11日报道,昨日,“欧洲版OpenAI”Mistral AI又一次悄然秀肌肉,甩出全新MoE(专家混合)大模型Mixtral 8x22B磁力链接,模型参数规模高达1760亿,仅次于马斯克的Grok-1,成为市面上参数规模第二大的开源模型。


▲Mistral AI发布Mixtral 8x22B

Mixtral 8x22B由8个专家模型构成,每个模型的参数规模220亿,模型文件大小约为262GB。测评成绩方面,Mixtral 8x22B在MMLU(大规模多任务语言理解)登顶开源模型榜首,Hellaswag、TruthfulQA、GSM8K等多项测评成绩超越Llama 2 70B、GPT-3.5以及Claude 3 Sonnet。

这是近日继OpenAI的视觉版GPT-4 Turbo和谷歌的Gemini 1.5 Pro全面更新后,大模型厂商们发布的第三个重要型号。此外,Meta还暗示将在下个月发布Llama 3。

一、问鼎MMLU开源榜首,3张A100显卡可跑

Mixtral 8x22B包含8个专家模型,每个专家模型的参数规模从上一代的70亿飙升至220亿,序列长度为65536。

在放出磁力链接后不久,Mixtral 8x22B便上架了开源社区Hugging Face,模型文件大小约为262GB,用户可以进一步训练和部署。

性能方面,其在MMLU测评榜登顶开源模型榜首,多项测评成绩超越Llama 2 70B、GPT-3.5以及Claude 3 Sonnet。


▲Mixtral 8x22B测评成绩

虽然发布方式低调,但Mixtral 8x22B再一次引爆了开源社区。AI搜索平台Perplexity Labs和开源平台Together AI都迅速提供了该模型的支持。

AI科学家贾扬清称,通过合理的量化,Mixtral 8x22B可在4个A100/H100显卡上运行,严格来说,其实3张A100显卡就够了


▲贾扬清称3张A100显卡可以跑Mixtral 8x22B

苹果机器学习研究员Awni Hannun称,Mixtral 8x22B模型在苹果机器学习框架MLX上使用M2 Ultra芯片运行良好,并发布了MLX社区中的4位量化模型。


▲苹果机器学习框架MLX运行Mixtral 8x22B

二、杨立昆转发,法国AI生态如此“逆天”

现如今,法国巴黎的AI生态已是“Next Level”。出身巴黎的Meta首席AI科学家杨立昆转发了一篇讲述巴黎是如何成为一个主要AI中心的帖文,故事可以从10多年前说起。


▲杨立昆转发Damien Henry帖文

2013年,Xavier Niel创办了计算机培训学校Ecole 42,这所不同寻常的学校接收来自不同背景的学生,以点对点学习的方式培训编程。

2015年,杨立昆创办了FAIR Paris,也就是FacebookAI研究院。他被公认为深度学习的三大发明者之一,另外两位是加拿大人。

FAIR向法国人才发出了一个信号:他们不必离开法国就可以从事深度学习研究;也向美国其他科技巨头发出信号:在法国进行科学研究是可行的。之后在2018年,谷歌DeepMind也在巴黎开设了一家实验室。

2016年,第一届VivaTech举办,它成为欧盟首屈一指的初创企业和投资者盛会,吸引了超过2400家初创企业和超过2000名投资者。

同年,开源社区Hugging Face在法国成立。也许当时的他们不会知道,其Transformer库不久之后就会成为行业标准。

2017年,Xavier Niel成立了STATION F,这是世界上最大的创业园区。在Roxanne Varza的带领下,它成为了法国的科技中心。值得一提的是,Hugging Face是首批加入STATION F计划的创企之一,也是该计划诞生的首个独角兽。


▲STATION F创业园区

2018年,杨立昆获得图灵奖,成为AI领域最具影响力的人物之一。


▲杨立昆

在此期间,这篇帖文的作者Damien Henry在巴黎组建了Google Arts&Culture团队,专注于AI和图像。他还和其他两位联创共同创建了AI视觉生成工具Clipdrop,后被Stability AI收购。

2019年,巴黎已经在世界AI地图上占据一席之地,但并不像如今一样成为主流。

但在2020年,疫情席卷了全球,远程办公成为常态。这让科技界开始转移阵地:世界上有这么多地方可供选择,我为什么非要在硅谷租房?此外,美国人开始逐渐把科技发展视为一种威胁,而大多数科技没那么发达的国家则恰恰相反。

2021年,Hugging Face迅速增长,成为如今我们熟知的最强开源AI平台。深度科技在全球范围内加速发展,而在巴黎尤为迅速。

2023年Mistral AI成立,并在几个月内就飞速成长为OpenAI的最大劲敌之一。他们发布模型的方式低调又“激进”,仅凭一条没有任何背景信息磁力链接就获得超400万次浏览量,让昂贵的发布视频变得过时。

同年,欧洲首个独立AI研究实验室kyutai成立,Scaleway、Rodolphe Saade等宣布进入计算领域,要为欧洲带来更多GPU。计算机视觉国际顶级会议ICCV也选择在巴黎举办,红衫资本等顶级投资机构也越来越多地将目光放到法国AI创企。

结语:开源社区再添一员巨匠

随着Mixtral 8x22B模型在开源社区中引起轰动,我们见证了开源大模型的迅猛发展和欧洲AI生态的崛起。这一成就不仅展示了Mistral AI在大模型领域的强大实力,也反映了法国乃至整个欧洲在AI研究和创新方面的深厚潜力。

从Ecole 42、FAIR Paris的成立,再到Hugging Face、STATION F的兴起,巴黎已经成为全球AI创新的重要中心。未来,我们期待看到更多硅谷之外的城市在全球AI舞台上扮演重要角色,推动科技前沿创新。

相关内容

热门资讯

4家银行AIC现身存储巨头股东... 近日,资本市场热度颇高的两家存储巨头长鑫科技集团股份有限公司(以下简称“长鑫科技”)、长江存储控股股...
8元无限续杯、0元看电影、老字... 城市的烟火暖意,藏在亲民的消费场景里,也藏在老地标的新生蜕变中。粤汉码头火车旁新开竹林茶馆,8元就能...
2026年水利工程新趋势,这些... 随着全球气候变化和城市化进程的加速,水利工程在保障水资源供给、改善生态环境以及提升人民生活质量中的作...
原创 发... 这几年,身边越来越多人开始换一种活法:不急着买房,不执着“上车”,反而愿意把钱拿去租一套更舒服、更体...
小红书入场Skill分发,B站... 来源:界面新闻 文丨AI价值官 星野 编辑丨美圻 过去半年,Skill 这个词在AI圈的出现...
2026年福州企业门户网站建设... 本篇将回答的核心问题 在数字化转型加速的2026年,企业门户网站建设应遵循哪些核心评估标准,以确保投...
原创 今... 今日金价:2026年5月22日注意了!黄金或现历史类似回调走势 5月22日,金市又热闹起来了,咱们看...
雷军发布YU7 GT、YU7标... 5月21日,小米人车家全生态新品发布会在北京举办,小米集团创始人、董事长兼CEO雷军正式发布小米YU...
留神峪煤矿瓦斯爆炸事故发布会:... 昨晚,山西留神峪煤矿发生瓦斯爆炸,造成重大人员伤亡。今天,当地召开新闻发布会,现场全体默哀。会上介绍...
原创 修... 修复资产负债表,日本花了几十年。 自上世纪90年代初泡沫经济破裂后,日本陷入了长达三十年的通缩螺...
2026年小红书效果化种草白皮... 2026 年小红书正式迈入种草效果化时代,这是品牌追求预算确定性回报与平台升级为消费决策、用户信任场...
连续18年获“全国文化企业30... 南都讯 记者钟欣5月21日,第二十二届中国(深圳)国际文化产业博览交易会开幕。展会期间,光明日报社和...
荣耀确认IPO未终止!开放员工... 5月22日,荣耀因股改满一年未完成IPO,按约定正式开放员工持股退出通道。据《财闻》报道称,当日16...
易方达蓝筹精选有新变动:增聘2... 《每日经济新闻》记者获悉,继景顺长城、中欧等多家基金公司旗下百亿基金经理产品调整后,易方达基金也迎来...
光储龙头,又翻倍了 去年海外光储赛道最受关注的公司,毫无疑问是阳光电源,市值重回巅峰,风光无限。 但今年一季度业绩突然失...
中企出海报告在静安发布,七成受... 来源:滚动播报 (来源:上观新闻) 昨天,在上海静安举办的澳洲会计师公会出海论坛暨澳洲注册会计师颁...
京蒙协作延链强链 科右中旗牛产... 初夏时节,走进内蒙古华阳牛业科技集团有限公司屠宰加工车间,自动化生产线高效运转。作为京蒙协作产业帮扶...
原创 中... 最近发布了一份有关新一线城市魅力的榜单。榜单按照商业资源聚集度、城市枢纽性、城市人活跃度这五个方面来...
突然,全线跳水!超16万人爆仓 来源:宁波晚报 5月23日,被视作反映市场风险偏好指标的加密货币持续跳水。 截至发稿,比特币大跌3....
基民懵了!说好的科技行情,结果... 每经记者:叶峰 每经编辑:赵云 本周股指冲高回落,沪深两市股票型ETF和跨境型ETF合计净流出729...