Meta第二代自研AI芯投产,摆脱英伟达依赖!为买H100小扎狂砸数百亿美元 meta重返中国市场 meta将斥巨资购英伟达ai芯片
admin
2024-02-03 16:34:59
0


新智元报道

编辑:编辑部

【新智元导读】Meta的第二代自研芯片正式投产!小扎计划今年部署Artemis AI芯片为AI提供算力,以减少对英伟达GPU的依赖。

Meta第二代自研AI芯片Artemis,今年正式投产!

据悉,新的芯片将被用于数据中心的推理(Inference)任务,并与英伟达等供应商的GPU一起协同工作。

对此,Meta的发言人表示:「我们认为,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平衡。」

除了更高效地运行的推荐模型外,Meta还需要为自家的生成式AI应用,以及正在训练的GPT-4开源竞品Llama 3提供算力。


Meta的AI贴纸功能,此前在Messenger、Instagram和WhatsApp上都处于测试阶段


OpenAI工程师Jason Wei在Meta的一次AI活动中听到,Meta现在有足够的算力来训练Llama 3和4。Llama 3计划达到GPT-4的性能水平,但仍将免费提供

不难看出,Meta的目标非常明确——在减少对英伟达芯片依赖的同时,尽可能控制AI任务的成本。

Meta成英伟达大客户

Meta CEO小扎最近宣布,他计划到今年年底部署35万颗英伟达H100 GPU,总共将有约60万颗GPU运行和训练AI系统。


这也让Meta成为了继微软之后,英伟达最大的已知客户。


小扎表示,目前Meta内部正在训练下一代模型Llama 3。

在35万块H100上训练的Llama 3,无法想象会有多大!



Omdia的研究数据显示,Meta在2023年H100的出货量为15万块,与微软持平,且是其他公司出货量的3倍。

小扎称,「如果算上英伟达A100和其他AI芯片,到2024年底,Meta将拥有近60万个GPU等效算力」。

性能更强、尺寸更大的模型,导致更高的AI工作负载,让成本直接螺旋式上升。

据《华尔街日报》的一位匿名人士称,今年头几个月,每有一个客户,微软每月在Github Copilot上的损失就超过20美元,甚至某些用户每月的损失高达80美元,尽管微软已经向用户收取每月10美元的费用。

之所以赔钱,是因为生成代码的AI模型运行成本高昂。 如此高的成本,让大科技公司们不得不寻求别的出路。

除了Meta之外,OpenAI和微软也在试图打造自己专有的AI芯片以及更高效的模型,来打破螺旋式上升的成本。


此前外媒曾报道,Sam Altman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络,为此他已经在和中东投资者以及台积电谈判

专为大模型定制AI芯

去年5月,Meta首次展示了最新芯片系列——「Meta训练和推理加速器」(MTIA),旨在加快并降低运行神经网络的成本。

MTIA是一种ASIC,一种将不同电路组合在一块板上的芯片,允许对其进行编程,以并行执行一项或多项任务。


内部公告称,Met首款芯片将在2025年投入使用,同时数据中心开启测试。不过,据路透社报道,Artemis已经是MTIA的更高级版本。

其实,第一代的MITA早就从2020年开始了,当时MITA v1采用的是7nm工艺。

该芯片内部内存可以从128MB扩展到128GB,同时,在Meta设计的基准测试中,MITA在处理中低复杂度的AI模型时,效率要比GPU还高。

在芯片的内存和网络部分,Meta表示,依然有不少工作要做。

随着AI模型的规模越来越大,MITA也即将遇到瓶颈,因此需要将工作量分担到多个芯片上。

当时,Meta团队还设计了第一代MTIA加速器,同样采用台积电7nm,运行频率为800MHz,在INT8精度下提供102.4 TOPS,在FP16精度下提供51.2 TFLOPS。它的热设计功耗(TDP)为25W。


2022年1月,Meta还推出了超算RSC AI,并表示要为元宇宙铺路。RSC包含2000个英伟达DGX A100系统,16000个英伟达A100 GPU。

这款超算与Penguin Computing、英伟达和Pure Storage合作组装,目前已完成第二阶段的建设。


参考资料:

https://www.reuters.com/technology/meta-deploy-in-house-custom-chips-this-year-power-ai-drive-memo-2024-02-01/

https://the-decoder.com/meta-deploys-its-artemis-ai-chip-to-reduce-reliance-on-nvidia-gpus/

相关内容

热门资讯

原创 3... 刚成立三个月的Humans&,种子轮直接拿下4.8亿美元,估值拉到44.8亿美元,结果呢,一脚跨进独...
11亿元债券展期通过,万科缓了... 万科企业股份有限公司(以下简称“万科”)11亿元债券展期议案获得持有人会议表决通过。 1月21日,万...
合力泰科技股份有限公司 202... 公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述和重大遗漏。 一、本...
山海:黄金走出预期的调整,力度... 山海:黄金走出预期的调整,力度还会延申! 完全符合预期,黄金冲高回落,走出大跌空间,周三一直强调黄...
【IPO追踪】实现“A+H”上... 1月22日,龙旗科技(603341.SH)(09611.HK)成功于港交所主板上市,成为又一家实现“...
西贝获新一轮融资 新荣记老板阿... 遭遇关店风波后,1月20日,西贝日获得新一轮融资。天眼查显示,投资方包括台州新荣泰投资有限公司、呼和...
浙商证券:维持非凡领越“买入”... 浙商证券发布研报称,维持非凡领越(00933)“买入”评级,目标价0.98港币,25H1利润扭亏释放...
封关后的海南免税:热度、变量与... 2025年12月18日,三亚凤凰国际机场口岸迎来海南全岛封关后首批入境旅客。图/新华 离岛免税是海南...
西贝获新一轮融资,新荣记张勇等... 如图所示,你如何评价?欢迎留言区讨论... 早安,艾瑞巴蒂(手动问好),一起来看今天的早报: 【黑马...
原创 银... 银行岗位曾在几十年来被视为金饭碗,不少年轻人为获得一份稳定工作,刻苦复习金融知识,通过层层笔试面试进...
如应对金价涨、租金困境?202... 最近想在新加坡开个珠宝店或金铺的朋友,得先搞清楚两件正在发生的大事。 这两件事直接决定了你现在入场,...
跨界并购风险点扎堆,康欣新材触... A股并购热潮持续升温,近一年跨界并购案层出不穷,其中,集装箱地板商康欣新材(600076.SH)拟收...
ETF盘中资讯|南向资金超百亿... 1月22日,港股早盘高开,互联网龙头走势分化,阿里巴巴-W、哔哩哔哩-W涨逾1%,美团-W、腾讯控股...
投资铜条火了!变现只能去废品站... 随着贵金属价格连创新高,此前一直不受关注的铜也成了“投资品”。不少珠宝集散地商家推出1000克规格的...
普京:收到加入“和平委员会”邀... 俄罗斯总统普京。视觉中国 资料图 据克里姆林宫网站21日消息,俄罗斯总统普京当天证实,美国总统特朗普...
郭晶晶代言的奶品巨头,要去港交... 文 | 节点财经,作者 | 安妮 1月19日,君乐宝乳业集团股份有限公司(简称“君乐宝”)正式向香...
国际金价屡创新高 回调风险需警... 来源:上海证券报 伦敦现货黄金走势图 黄金,再度迎来历史性时刻。 北京时间1月21日,国际金价首次...
大摩强call!半导体设备ET... 1月22日,半导体设备盘前异动!数据显示,截至9时24分,半导体设备ETF(561980)涨1.44...
金融科技对传统银行有哪些影响? 在数字化浪潮持续深化的背景下,金融科技的快速迭代正从多个维度对传统银行的运营模式、服务体系及行业定位...