谷歌推出其最先进AI模型Gemini,希望击败GPT-4 谷歌gemini被曝算力达gpt-4的五倍 谷歌发布ai大模型
admin
2023-12-07 14:49:26
0

·谷歌宣布推出其规模最大、功能最强大的新大型语言模型Gemin,其最强大的TPU“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。

·“谷歌运行了32个完善的基准测试来比较Gemini和GPT-4,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”谷歌DeepMind首席执行官德米斯·哈萨比斯表示,“我认为我们在32项基准中的30项中大幅领先。”

美国东部时间12月6日,谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺这些芯片的速度明显快于v4 TPU。

一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创造了当前人工智能热潮背后大部分基础技术的谷歌措手不及,一度发布了内部“红色警报”(red code)。一年零一周后,谷歌似乎准备好了反击。

谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)在发布会上正面谈及GPT-4与Gemini的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯略带微笑地表示,“我认为我们在32项基准中的30项中大幅领先。”

从发布日起,Gemini开始应用于Bard和Pixel 8 Pro智能手机,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。

“Gemini Pro性能优于GPT-3.5”

大型语言模型Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,能够击败GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。


Gemini包括一套三种不同规模的模型。

目前,谷歌计划通过谷歌云将Gemini授权给客户,供他们在自己的应用程序中使用。12月13日开始,开发者和企业客户可以通过谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(应用程序编程接口)访问Gemini Pro,安卓人员可以使用Gemini Nano完成构建。从发布会当天开始,谷歌聊天机器人Bard将使用 Gemini Pro来实现高级推理、规划、理解和其他功能。明年初,谷歌将推出“​Bard Advanced,其将使用Gemini Ultra,这代表了Bard发布以来的最大更新。

据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客文章中表示,它可以理解复杂主题中的细微差别和推理。

据哈萨比斯介绍,在对比Gemini和GPT-4的基准测试中,Gemini最明显的优势来自于它理解视频和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感官模型。

而据CNBC报道,谷歌高管们在新闻发布会上表示Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。对于谷歌是否计划对Bard Advanced的访问收费,谷歌Bard总经理萧茜茜(Sissie Hsiao)表示,谷歌专注于创造良好的体验,目前还没有任何相关盈利的细节。

“我们一直对非常通用的系统感兴趣。”哈萨比斯说,他对如何混合所有这些模态特别感兴趣,“从任意数量的输入和感知中收集尽可能多的数据,然后给出尽可能多的响应。”

Gemini最基本的模型是文本输入和文本输出,但更强大的模型(如Gemini Ultra)可以处理图像、视频和音频。哈萨比斯说,它甚至会变得更加通用,有像动作和触摸之类更像机器人类型的东西。他认为,随着时间的推移,Gemini将获得更多的感知,变得更有意识,并在这个过程中变得更加准确和稳定。“这些模型只是更好地了解周围的世界。当然,这些模型仍然存在幻觉,并且仍然存在偏见和其他问题。”但哈萨比斯表示,它们知道的越多,就会做得越好。

谷歌似乎特别将编码视为Gemini的杀手级应用程序,它使用了一种名为AlphaCode 2的新代码生成系统,据称该系统的性能优于85%的编码竞赛参与者,而原始AlphaCode的这一比例为50%。谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,用户会注意到模型涉及的几乎所有方面都有所改进。

“不愿为了跟上步伐而走得太快”

值得注意的是,在今年5月,包括哈萨比斯在内的500多名著名学者和行业领袖签署的一份声明称,“与流行病和核战争等其他社会规模风险一样,减轻人工智能带来的灭绝风险应该成为全球优先事项。”

在这次发布会中,哈萨比斯和皮查伊对于谷歌似乎步调缓慢的说法回应道,他们不愿意为了跟上步伐而走得太快,“尤其是当我们越来越接近人工智能的终极梦想‘通用人工智能’时”。“当我们接近通用人工智能时,事情将会有所不同。”哈萨比斯说,“这是某种具有主动性的技术,所以我认为我们必须谨慎对待,谨慎但乐观。”

谷歌表示,通过内部和外部测试以及警示团队(red-teaming),它一直在努力确保Gemini的安全和责任。皮查伊指出,确保数据的安全性和可靠性对于企业优先的产品尤为重要,这也是大多数生成式人工智能利润的来源。与此同时,哈萨比斯也承认,推出最先进的人工智能系统的风险之一就是,它会出现没人能预测到的问题和攻击向量(attack vector)。

“这就是为什么你必须释放一些东西,去观察和学习。”哈萨比斯说。谷歌发布Gemini Ultra的速度特别慢,哈萨比斯把它比作一个可控的测试版,这为谷歌最强大、最不受约束的模型提供了一个“更安全的试验区”。“基本上,如果Gemini有一个破坏婚姻的另类人格,谷歌会在你之前找到它。”这番话影射了此前微软必应聊天机器人向《纽约时报》专栏作家凯文·卢斯(Kevin Roose)求婚,并试图拆散他的婚姻。

谷歌最强TPU与AI超级计算机

与新模型一起亮相的,还有新版本的TPU芯片TPU v5p,旨在减少训练大语言模型相关的时间投入。TPU是谷歌为神经网络设计的专用芯片,经过优化可加快机器学习模型的训练和推断速度,谷歌于2016年起开始推出第一代TPU。


谷歌TPU芯片参数比较。

据谷歌介绍,与TPU v4相比,TPU v5p的浮点运算性能提升了两倍,在高带宽内存方面提高了3倍。使用谷歌的600 GB/s芯片间互连,可以将8960个v5p加速器耦合在一个Pod(通常指一个包含多个芯片的集群或模块)中,从而更快或更高精度地训练模型。作为参考,该值比TPU v5e大35倍,是TPU v4的两倍多。

谷歌称,TPU v5p是其迄今为止最强大的,能够提供459 teraFLOPS(每秒可执行459万亿次浮点运算)的bfloat16(16位浮点数格式)性能或918 teraOPS(每秒可执行918万亿次整数运算)的Int8(执行8位整数)性能,支持95GB的高带宽内存,能够以2.76 TB/s的速度传输数据。

谷歌表示,所有这些意味着TPU v5p可以比TPU v4更快地训练大型语言模型,如训练GPT-3(1750亿参数)这样的大语言模型速度比TPU v4快2.8倍。

不过,这种更高的性能和可扩展性也是有代价的。每个TPU v5p加速器的运行费用为每小时4.2美元,而TPU v4加速器为每小时3.22美元,TPU v5e加速器每小时1.2美元。


谷歌TPU芯片训练大模型的参数比较。

“在我们的早期使用阶段,谷歌DeepMind和谷歌Research观察到,与我们的TPU v4芯片相比,使用TPU v5p芯片的大语言模型(LLM)训练工作负载的速度提高了2倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌入密集型工作负载的性能有了显着提高。TPU对于我们在Gemini等尖端模型上进行最大规模的研究和工程工作至关重要。”

除了新硬件之外,谷歌还引入了“人工智能超级计算机”的概念。谷歌云将其描述为一种超级计算架构,包括一个集成系统,具有开放软件、性能优化硬件、机器学习框架和灵活的消费模型。

谷歌计算和机器学习基础设施部门副总裁马克·洛迈尔(Mark Lohmeyer)在博客文章中解释道,“传统方法通常通过零碎的组件级增强来解决要求苛刻的人工智能工作负载,这可能会导致效率低下和瓶颈。”“相比之下,人工智能超级计算机采用系统级协同设计来提高人工智能训练、调整和服务的效率和生产力。”这可以理解为,与单独看待每个部分相比,这种合并将提高生产力和效率。换句话说,超级计算机是一个系统,其中任何可能导致性能低下的变量(硬件或软件)都受到控制和优化。

相关内容

热门资讯

掌上工美白银交易APP不靠谱是...   提示在掌上工美做白银的投资者:若您有意参与商品期货交易,请务必通过中国证监会批准的正规期货公司开...
长安银行整合“长银系”村镇银行... 近日,金融监管部门发布批复,同意解散陕西太白长银村镇银行股份有限公司、乐山昆仑村镇银行有限责任公司,...
继续加仓,继续满怀希望 一、市场概览:分化格局下的结构性机会 1.1 市场情绪监测 根据实时情绪指标监测(18:07数据):...
房地产专题报告:收储助力房地产... 报告聚焦存量房与闲置土地收储,分析政策推进、落地实践、资金支撑及市场影响,指出收储已成为房地产去库存...
泓德红利优选混合(LOF)A:... AI基金泓德红利优选混合(LOF)A(501227)披露2025年年报,2025年基金利润1245....
360推“虾书”APP,AI社... 4月8日,据《读佳》报道,360集团正在开发一款名为“虾书”的全新社区APP,主打AI自主社交。该产...
字节跳动33亿元在北京再次拿地... 红星资本局4月8日消息,近日,北京市公共资源交易服务平台披露的信息显示,字节跳动全资控股的北京云岫长...
生猪期货跌近4%创上市新低,期... 文|财联社 今日国内生猪市场期现价格同步走弱,生猪期货主力合约早盘一度跌近4%,最低触及9125元...
英特尔加入马斯克Terafab... 英特尔正式加入埃隆·马斯克的"Terafab"项目,这是一项横跨特斯拉、SpaceX和xAI的大规模...
张雪机车LOGO被指抄袭,设计... 新京报记者 林子 编辑 陈莉 校对 穆祥桐 4月8日,有网友在社交平台上指出,张雪机车的LOGO涉嫌...
原创 2... 2025年全球GDP数据新鲜出炉,看完这份前20强榜单,真是几家欢喜几家愁,也藏着不少值得说道的细节...
资金“淤积”规模或超万亿,推动... 财联社4月8日讯(编辑 李响)步入4月,银行间市场超宽松的流动性,被业内戏称“水漫金山”,这从存单的...
今世缘回复投资机构28问:四开... 近日,今世缘发布了《江苏今世缘酒业股份有限公司投资者来访接待记录表》(2026年3月) ,今世缘董事...
创业板指涨逾5%,两市超470... A股三大指数持续走高,创业板指午后涨超5%,深成指涨超4%,沪指涨超2%。截至13:21,沪深两市合...
美伊停火两周!现货黄金站上48... 北京商报讯(记者 宋亦桐)受美国与伊朗达成有条件停火两周的消息提振,此前承压的黄金、白银价格迎来强势...
哀鸿遍野!城堡、千禧等对冲基金... 来源:金十数据 谁能想到,中东的一声炮响不仅推高了油价,更是直接把华尔街的对冲基金们“打成了重伤”...
创新高!千亿市值华友钴业202... 图片来源:图虫 4月7日晚间,华友钴业(603799.SH)发布2025年年度报告,报告期内公司实现...
从收租到赋能,广州专业市场重塑... 4月8日,《广州市加快推动专业市场转型升级高质量发展行动方案(2026—2028年)》正式发布。考虑...
史上最大规模IPO,最新披露 据央视财经援引路透社7日报道,美国企业家马斯克旗下太空探索技术公司(SpaceX)最新披露了其首次公...
【IPO追踪】又一匹黑马?希迪... 4月8日,港股的希迪智驾(03881.HK)大涨16.34%,报25.06港元/股,市值突破百亿大关...