响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零” 扬言吊打英伟达的ai芯片 中国能赶超英伟达的ai芯片吗
admin
2024-02-22 02:40:54
0

就在全世界还沉浸在Sora带来的视觉震撼时,AI圈又出了一个“王炸”产品,这一次是在芯片领域。

自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。


▲Groq芯片

不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快,达到普通人打字速度的75倍,比英伟达芯片的响应速度快10倍以上。对于习惯了ChatGPT等AI产品“一个字一个字蹦出答案”的用户来说,如今看到AI模型生成文章的速度比“眨眼睛还快”,其震撼程度可想而知。

Groq芯片大获好评

响应速度比英伟达快十倍以上

Groq在20日宣布对AI云服务平台进行免费开放体验,该公司官方账号还在社媒发文,鼓励粉丝积极参与互动。这次Groq在服务器上运行了Meta公司开发的Llama二代大模型等产品,因为和ChatGPT等闭源产品不同,Llama等模型是开源产品,允许其他厂商使用。

很快,体验了“无卡顿”状态的用户们对Groq发出了惊叹和赞美,“刷屏”了整个AI圈。比如,一位市场营销行业的用户截屏说明了自己的体验:Groq云服务平台针对他提出的专业领域问题,仅用4秒钟就生成了上千个英文单词的回答,而且这一回答真实可信,并附有注释和资料来源。

还有人用实验证明,Groq云服务平台搭配Llama2-70B模型,可以在7分钟之内打出和莎士比亚名篇《哈姆雷特》同样多单词量的文章,这一速度至少是普通人打字速度的75倍。有业界人士评论称,Groq芯片在响应速度上完全秒杀英伟达,给那些“喜欢低延迟体验”的用户带来了极大的惊喜。


▲Groq官网鼓励用户体验“全球最快的大模型输出速度”

在此之前,用户们已经普遍习惯了由英伟达芯片驱动下的AI大模型十分缓慢的答复速度,“就像看着对面打字的人一个字一个字地往外蹦出答案”。而在Groq云服务平台,用户可谓“目不暇接”,AI生成答案的速度远远超过肉眼阅读的速度。

专业测评显示,Groq芯片搭配Llama二代模型可以达到每秒近500个token,如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算,英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。

技术路线不同形成速度优势

专家称不应过度拔高其表现

众所周知,英伟达已经成为AI时代全球最大的芯片赢家,凭借着极其强大的性能让各路AI厂商疯狂“抢货”。英伟达就像AI时代的“军火商”,旗下的芯片成为各路豪强争抢的先进武器。那么,为何Groq芯片的响应速度会远超英伟达呢?这里主要是因为Groq选择了完全不同的技术路线。

Groq公司官网介绍,该公司是全球范围内首个创造了LPU(语言处理单元)技术路线的芯片厂商,而英伟达采用的是主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构。另外,通过LPU也在能效上更胜一筹,让芯片更“饱和”地进行计算,提高了处理效率。

正因如此,LPU在速度上“独领风骚”,但GPU在深度学习上还是没有竞争对手可以匹敌。目前Groq生产的LPU芯片还不能被用于训练大模型,只能用于AI推理(即使用训练好的AI大模型生产答案)。


▲Groq官网称自家芯片(左)的设计效率远超竞争对手(右)

阿里前技术副总裁贾扬清点评道,虽然他本人非常欣赏Groq公司,但LPU芯片的成就不应该被过度拔高。他举例表示,Groq以极端方式追求处理速度而牺牲内存和并行运算能力,导致能由一块英伟达芯片处理的计算量理论上需要几百块Groq芯片组装到一起才能完成。这样虽然英伟达芯片的单价更为昂贵,但如果选择使用Groq芯片训练大模型,还要付出更多倍的代价。

Groq创始人兼CEO乔纳森·罗斯此前对媒体表示,在大模型推理场景下Groq芯片的速度比英伟达快10倍,但价格和耗电量都仅为后者的十分之一。这一点也被业内人士指出是“片面的宣传”。

芯片行业专家姚金鑫也以个人名义撰文表示,英伟达作为AI芯片领域绝对的领先者,人们期待出现挑战英伟达的对手,但对Groq芯片的表现不应过度拔高。姚金鑫称,“速度在这里成了Groq的双刃剑”,Groq的架构建立在小内存、大算力的基础上,因此有限的内容对应着极高的算力,导致其速度非常快。但是反过来说,Groq极高的速度是建立在很有限的吞吐能力上的,每张芯片能够处理的内容量太小。

创始人曾是谷歌工程师

豪言将把计算成本“降至零”

Groq公司总部坐落在美国加州山景城,这里也是谷歌等众多科技巨头的总部所在地,这也和创始人乔纳森的出身有关。

乔纳森曾经是谷歌工程师,在工作中他痛感传统的CPU和GPU等处理单元的表现存在很大“瓶颈”,芯片的运算能力并没有被发挥到极致。因此他选择了辞职创业,招募了很多硅谷巨头企业的工程师一起研究新的技术路线。乔纳森曾表示,Groq的公司使命必须是有颠覆性的,“我们致力于将计算的成本降至零,以此释放人工智能的所有潜力”。

运用自己强大的技术能力、人脉和管理经验,Groq被乔纳森经营得有声有色。2022年12月,Groq宣布获得由老虎环球基金领投的C轮融资,融资额度高达300亿美元,该公司也因强大的“吸金”能力让AI圈刮目相看。2023年8月,Groq宣布选择三星Foundry泰勒工厂为其生产4纳米制程的AI加速器芯片。这座工厂是三星在美国大手笔建造的标志性项目,Groq成为其第一家客户,也标志着三星正式加入AI赛道的战场。

而到了今天,Groq又以“10倍英伟达”的闪电速度再次刷屏出圈,这家规模很小的初创企业成为了AI行业格局中不可忽视的搅局者。乔纳森曾经总结过自己的经营哲学,“我喜欢小团队快速作战,就像出发狩猎大象的猎人只需要带很少的干粮就能活很久。一旦打下了大象,就可以够他吃很长时间了。”

红星新闻记者 郑直

编辑 何先锋 责编 冯玲玲

相关内容

热门资讯

路透解析“马斯克集团”:Spa... SpaceX 凤凰网科技讯 北京时间1月31日,据路透社报道,长期以来,埃隆·马斯克(Elon Mu...
启动“二改” 永辉在京完成21... 北京商报讯(记者 赵述评 实习记者 毛思怡)1月31日,永辉超市北京龙湖长楹天街店经一个多月闭店调改...
《宜宾散装白酒连锁经营规范》团... 近日,由宜宾市酒类协会牵头归口、宜宾安宁酒厂主导起草,四川谊宾酒业、宜宾学院、劲牌南溪酒业等多家本地...
印度牙医博士打造全印首款人形机... 2026 年 1 月 23 日,印度浦那的 Muks Robotics 正式宣布,自主研发的社交人形...
金银价创新高,引发全球“贵金属... 【环球时报记者 倪浩 环球时报特约记者 甄翔】连日来,国际市场金银价格持续大涨。1月29日当天,亚太...
财经观察丨“爱你老己”背后的消... 新华网北京1月31日电岁末年初,一句“爱你老己,明天见”席卷社交网络,成为年轻人自我关怀的新表达。热...
重磅!珠海科技产业集团与农行广... 1月30日,珠海科技产业集团与中国农业银行广东省分行在广州签署全面战略合作协议暨独立授信合作。农行广...
原创 黄... 谁能想到,2026年开年就上演金融魔幻现实主义! 国际黄金1月31日凌晨暴跌9.25%,盘中狂泻12...
云南省本级社会保险基金银行存款... 近日,云南省财政厅、云南省人力资源和社会保障厅、云南省医疗保障局联合印发《云南省本级社会保险基金银行...
病毒在身体里“安家”却相安无事... 很多人听说“乙肝携带者”,总会下意识和“乙肝患者”画上等号,担心自己或身边人被传染,也害怕携带者最终...
库迪确认:取消全场9.9元 来源:滚动播报 (来源:新消费日报) 有消息称,库迪咖啡发布门店价格策略和活动调整通知。通知指出,...
原创 雷... 不知道大家有没有发现,这个周六可能是进入2026年之后最消停的一个周六。因为各品牌基本上都没什么大事...
原创 特... 特朗普对委内瑞拉的举动,表面上看是一场能源棋局,实则背后隐藏着深刻的战略考量。对他而言,掌握能源就意...
原创 李... 01、“私募魔女”李蓓再引争议 半夏投资创始人、“私募魔女”李蓓,最近又成为投资圈的焦点。 1月2...
爱美客:AestheFill产... 上证报中国证券网讯(记者 王子霖)备受医美行业瞩目的AestheFill产品独家经销权纠纷迎来重要进...
雷军明晚直播,在北京小米汽车工... IT之家 1 月 31 日消息,今天午间,小米创办人、董事长兼 CEO 雷军在微博发文宣布,2 月 ...
字节阿里DeepSeek决战春... 新智元报道 编辑:艾伦 【新智元导读】这个春节,中国 AI 迎来「决战时刻」。据《The Info...
皇台酒业开始过年? 富凯摘要:有钱没钱喝酒过年。 作者|欧文 1月30日,白酒板块再现分化行情,皇台酒业却延续强势表现,...
深交所修订可持续发展报告编制指... 上证报中国证券网讯 据深交所1月30日消息,深交所发布实施《深圳证券交易所上市公司自律监管指南第3号...
面试餐饮|新手零经验,小红书开... 有没有餐饮人跟我一样?想靠小红书引流拓客,却卡在第一步:不知道怎么开店、怎么发笔记不踩雷,看着别人的...