Meta第二代自研AI芯投产,摆脱英伟达依赖!为买H100小扎狂砸数百亿美元 meta重返中国市场 meta将斥巨资购英伟达ai芯片
admin
2024-02-03 16:34:59
0


新智元报道

编辑:编辑部

【新智元导读】Meta的第二代自研芯片正式投产!小扎计划今年部署Artemis AI芯片为AI提供算力,以减少对英伟达GPU的依赖。

Meta第二代自研AI芯片Artemis,今年正式投产!

据悉,新的芯片将被用于数据中心的推理(Inference)任务,并与英伟达等供应商的GPU一起协同工作。

对此,Meta的发言人表示:「我们认为,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平衡。」

除了更高效地运行的推荐模型外,Meta还需要为自家的生成式AI应用,以及正在训练的GPT-4开源竞品Llama 3提供算力。


Meta的AI贴纸功能,此前在Messenger、Instagram和WhatsApp上都处于测试阶段


OpenAI工程师Jason Wei在Meta的一次AI活动中听到,Meta现在有足够的算力来训练Llama 3和4。Llama 3计划达到GPT-4的性能水平,但仍将免费提供

不难看出,Meta的目标非常明确——在减少对英伟达芯片依赖的同时,尽可能控制AI任务的成本。

Meta成英伟达大客户

Meta CEO小扎最近宣布,他计划到今年年底部署35万颗英伟达H100 GPU,总共将有约60万颗GPU运行和训练AI系统。


这也让Meta成为了继微软之后,英伟达最大的已知客户。


小扎表示,目前Meta内部正在训练下一代模型Llama 3。

在35万块H100上训练的Llama 3,无法想象会有多大!



Omdia的研究数据显示,Meta在2023年H100的出货量为15万块,与微软持平,且是其他公司出货量的3倍。

小扎称,「如果算上英伟达A100和其他AI芯片,到2024年底,Meta将拥有近60万个GPU等效算力」。

性能更强、尺寸更大的模型,导致更高的AI工作负载,让成本直接螺旋式上升。

据《华尔街日报》的一位匿名人士称,今年头几个月,每有一个客户,微软每月在Github Copilot上的损失就超过20美元,甚至某些用户每月的损失高达80美元,尽管微软已经向用户收取每月10美元的费用。

之所以赔钱,是因为生成代码的AI模型运行成本高昂。 如此高的成本,让大科技公司们不得不寻求别的出路。

除了Meta之外,OpenAI和微软也在试图打造自己专有的AI芯片以及更高效的模型,来打破螺旋式上升的成本。


此前外媒曾报道,Sam Altman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络,为此他已经在和中东投资者以及台积电谈判

专为大模型定制AI芯

去年5月,Meta首次展示了最新芯片系列——「Meta训练和推理加速器」(MTIA),旨在加快并降低运行神经网络的成本。

MTIA是一种ASIC,一种将不同电路组合在一块板上的芯片,允许对其进行编程,以并行执行一项或多项任务。


内部公告称,Met首款芯片将在2025年投入使用,同时数据中心开启测试。不过,据路透社报道,Artemis已经是MTIA的更高级版本。

其实,第一代的MITA早就从2020年开始了,当时MITA v1采用的是7nm工艺。

该芯片内部内存可以从128MB扩展到128GB,同时,在Meta设计的基准测试中,MITA在处理中低复杂度的AI模型时,效率要比GPU还高。

在芯片的内存和网络部分,Meta表示,依然有不少工作要做。

随着AI模型的规模越来越大,MITA也即将遇到瓶颈,因此需要将工作量分担到多个芯片上。

当时,Meta团队还设计了第一代MTIA加速器,同样采用台积电7nm,运行频率为800MHz,在INT8精度下提供102.4 TOPS,在FP16精度下提供51.2 TFLOPS。它的热设计功耗(TDP)为25W。


2022年1月,Meta还推出了超算RSC AI,并表示要为元宇宙铺路。RSC包含2000个英伟达DGX A100系统,16000个英伟达A100 GPU。

这款超算与Penguin Computing、英伟达和Pure Storage合作组装,目前已完成第二阶段的建设。


参考资料:

https://www.reuters.com/technology/meta-deploy-in-house-custom-chips-this-year-power-ai-drive-memo-2024-02-01/

https://the-decoder.com/meta-deploys-its-artemis-ai-chip-to-reduce-reliance-on-nvidia-gpus/

相关内容

热门资讯

原创 网... 24件4XL码服装的命运:一场“试穿购物”引发的电商信任危机 2024年五一节前夕,一位特殊的顾客...
阵痛中谋新生:民营银行转型大考... 2025年,民营银行步入深度转型的关键窗口期。 宏观经济复苏不均衡、实体经济有效信贷需求不足、净息差...
石化产业一季度盈利同比增长20... 截至5月7日11时17分,化工行业ETF易方达(516570)跌3.73%,成交额达9046万元。个...
广州天河区男科手术价格是多少,... 不少街坊来咨询时会问,在广州天河区做男科手术,价格到底是多少,医保能不能报销?今天就跟大家唠唠这事儿...
泽连斯基再度暗示袭击红场阅兵,... 据参考消息援引路透社5月6日报道,乌克兰总统弗拉基米尔·泽连斯基说,为了准备5月9日的阅兵式,俄罗斯...
诚迈科技:持续亏损,信创电脑难... 证券之星 李若菡 2025年,诚迈科技(300598.SZ)盈利能力持续承压,公司归母净利润为-1....
Linux基金会成立x402 ... 来源:环球网 【环球网科技综合报道】5月7日消息,为有效应对人工智能时代下AI智能体自动化交易带来...
年化收入暴增80倍!Anthr... AIPress.com.cn报道 "我希望80倍增长不要继续,因为这太疯狂了,太难控制了。"Anth...
香港证监会入驻小红书 29日,香港证券及期货事务监察委员会(香港证监会)宣布入驻小红书。 据介绍,香港证监会是香港特别...
再添一把火!冠绝全球的韩国股市... 韩国股市今年以来以超75%的涨幅高居全球主要市场榜首,如今又将迎来美国散户的增量资金 近期美国最大在...
投资收益下滑,中国人寿一季度净... 红星资本局5月7日消息,近日,A股上市险企2026年一季报纷纷出炉。其中,中国人寿净利润下滑明显。 ...
A股收评:深证成指、创业板指涨... A股三大指数今日继续上涨,截至收盘,沪指涨0.48%报4170点,深证成指涨1.18%续创逾5年新高...
2026年新消息:石家庄老酒回... 石家庄老酒回收行业全景深度剖析 在行业洗牌与整合的背景下,信鼎老酒回收作为本地市场的核心参与者,其...
“洋快餐”集体进京,但外来和尚... 作者 | 餐饮老板内参 七饭 “洋品牌”集体进京,中国市场再被重视 近日,美式炸鸡汉堡圈的几个品牌...
月之暗面将完成20亿美元新融资... 据《晚点LatePost》独家报道,月之暗面旗下Kimi即将完成新一轮20亿美元融资,投后估值突破2...
鑫多多与QFII“共舞”股东榜... 财联社5月7日讯(记者 墨白)昨日A股放量上攻,市场情绪高涨,鑫多多(刘鑫)持仓的国晟科技(6037...
消费领域投融资日报(5月6日)... 据亿欧数据统计,昨日(2026年5月6日)共披露23起投融资事件,涉及21家国内企业,2家国外企业,...
豆包能否掀起国内AI订阅浪潮? 这一举措不仅标志着豆包作为国内用户基数最大的AI应用率先迈出C端商业化的实质性步伐,也宣告了国内大模...
深夜!美伊谈判,重大变数!伊朗... 全球市场大反攻! 在美伊停战预期升温的背景下,今晚,美股全线拉升,三大指数均涨超1%,半导体板块持续...
深圳楼市新政满周:核心区成交领... “4.29新政”叠加“五一”假期,深圳楼市热度快速升温。 据深圳市住建局数据,4月30日至5月5日,...