谷歌发布Gemini 1.5,能自动识别视频中的幽默梗,目前仅面向部分用户 谷歌发布Gemini 1.5,能自动识别视频中的幽默梗,目前仅面向部分用户
admin
2024-02-16 18:49:50
0

当地时间 2 月 15 日, 推出 Gemini 1.5 Pro,其在处理大量视频、文本和图像的能力上得到增强。

2023 年 12 月, 推出 Gemini 1.0 版本,按照大小和复杂性可以分为 Nano 版、Pro 版、Ultra 版。本次新版本正是在此基础之上打造而来。

据了解,只有一部分被精选之后的开发人员和企业客户,可以使用 Gemini 1.5 Pro 的预览版。

表示,Gemini 1.5 Pro 在性能上与其之前的顶级型号 Gemini 1.0 Ultra 相匹配,但使用的计算能力较低。

至关重要的是,Gemini 1.5 Pro 模型可以处理来自用户的大量数据。虽然每个 AI 模型都有其可以消化的数据量上限,但新 Gemini 1.5 Pro 的标准版本可以处理多达 128000 个 tokens 的输入。

这些 tokens 是 AI 模型将输入分解成的单词或单词的一部分,与 GPT-4 的最佳版本(GPT-4 Turbo)相当。

目前,开发者能向 Gemini 1.5 Pro 最多提交 100 万个 tokens,这相当于大约 1 小时的视频、11 小时的音频或 700000 字的文本。毫无疑问这是一个巨大的飞跃,使得我们可以做目前其他模型无法做到的事情。

在展示的一段演示视频中,研究人员使用百万 tokens 版本向模型提供了一份 402 页的阿波罗登月任务记录。

然后,他们向 Gemini 展示了一张手绘的靴子草图,并要求它识别该图画所代表的记录中的时刻。

“这是尼尔·阿姆斯特朗(Neil Alden Armstrong)登陆月球的那一刻,”Gemini 正确地回答道,“他说,‘个人的一小步,人类的一大步。’”

这款模型还能够识别幽默时刻。当研究人员要求在阿波罗记录中找到一个有趣的时刻时,它找到了宇航员迈克·柯林斯(Mike Collins)将阿姆斯特朗称为“沙皇”(可能不是最好的台词)。

在另一次演示中,该团队上传了一部由美国默片时代演员巴斯特·基顿(Buster Keaton)主演的 44 分钟无声电影,并要求人工智能识别一张纸上的信息。

这张纸在电影中的某个时刻,会从人物的口袋中取出。不到一分钟,模型就找到了这一场景,并正确回忆出了纸上写的文字。


研究人员还重复了阿波罗实验中的类似任务,要求模型根据绘图找到电影中的场景,结果它也能完成这一任务。

表示,它对 Gemini 1.5 Pro 进行了开发大型语言模型时通常会使用的一系列测试,包括结合文本、代码、图像、音频和视频的评估。

该团队发现 Gemini 1.5 Pro 在 87% 的基准测试中优于 Gemini 1.0 Pro,并且在所有基准测试中或多或少与 Gemini 1.0 Ultra 相当,同时使用的计算能力更少。

表示,处理更大输入的能力是专家混合架构取得进展的结果。使用这种设计的人工智能将其神经网络分成多个块,只激活与手头任务相关的部分,而不是立即启动整个网络。

并不是唯一使用这种架构的公司;法国人工智能公司 发布了一个使用它的模型,据传 GPT-4 也采用了该技术。

深度学习团队负责人奥瑞尔·威亚斯()表示:“在某种程度上,它的运作方式很像我们的大脑,但并不是整个大脑一直都在激活。” 这种划分可以节省人工智能的计算能力,并且可以更快地生成响应。

艾伦人工智能研究所前技术总监奥伦·埃齐奥尼()没有参与这项工作,他说:“这种在不同模式之间来回流动并利用它来搜索和理解的流动性非常令人印象深刻。”“这是我以前从未见过的东西。”

这种可以跨模式运行的人工智能,和人类的行为方式更加相似。“人们天生就是多模式的,”说,因为我们可以毫不费力地通过在说话、写作、绘图、制表之间切换来传达想法。

然而,警告不要从事态发展中获得太多意义。“有一句著名的台词,”他说,“永远不要相信人工智能演示。”

目前尚不清楚演示视频遗漏了多少内容或从各种任务中精心挑选了多少内容(确实因其早期 Gemini 发布没有透露视频已被加速而受到批评。)

如果输入措辞稍作调整,模型也可能无法复制某些演示。表示,人工智能模型总体来说是脆弱的。

另外,此次发布的 Gemini 1.5 Pro 仅限于部分开发者和企业客户。没有具体说明何时可以进行更广泛的发布。

运营/排版:何晨龙


01/

02/

03/


05/

相关内容

热门资讯

资源板块成“香饽饽”!成交额占... 财联社1月28日讯(编辑 梓隆),今日(1月28日),资源类板块成为市场关注焦点,其中,有色金属、石...
我国公募基金总规模逼近38万亿 1月28日,中基协发布的公募基金市场数据显示,截至2025年12月底,我国境内公募基金管理机构共16...
二度折戟!阳光诺和12亿关联收... (图片来源:视觉中国) 蓝鲸新闻1月28日讯(记者 邵雨婷)1月27日晚间,阳光诺和(688621....
泰国新出黄金交易限制措施 泰国皇家公报公布的新规规定,过去5年间年均黄金交易额达到或超过100亿泰铢(约合3.23亿美元)的黄...
SpaceX估值1.5万亿背后... 当特斯拉股价还在震荡时,埃隆·马斯克又给资本市场投下一枚"星际炸弹"——SpaceX计划于6月IPO...
首台中国车来了!雷军宣布小米S... 快科技1月28日消息,今日,小米CEO雷军宣布,小米SU7 Ultra将于1月29日14:00正式入...
2026年“苏超”赞助商激增:... 每经记者|王紫薇 每经编辑|文多 如果说2025年“苏超”(江苏省城市足球联赛)的赞助商们是看到流...
北大国发院最新报告:促消费的关... 今年是“十五五”规划的开局之年,中国经济版图上,“内需”二字的分量从未如此之重。 从2024年中央经...
中瑞世联资产评估集团被出具警示... 蓝鲸新闻1月28日讯,近日,湖南证监局发布行政监管措施决定书,剑指中瑞世联资产评估集团有限公司、黄新...
龙虎榜 | 8.34亿重仓!资... 1月28日,沪指涨0.27%,深证成指涨0.09%,创业板指跌0.57%。全市场成交额2.99万亿元...
原创 联... 2026年1月27日,印度和欧盟终于敲定了一份谈了将近二十年的自由贸易协议。 这一步一走,直接把全球...
多地推出以旧换新等举措激发“春... 本报记者 张芗逸 随着春节这一传统消费旺季的临近,各地纷纷加大促消费、惠民生政策力度,通过发放消费补...
万科多只债券涨幅显著 “21万... 观点网讯:1月28日 ,交易所债券市场收盘,万科多只债券表现强势。“21万科04”涨超10%,“22...
朱少醒重仓入场!黄金股的盛宴是... 牛犇 1月28日,A股继续震荡冲高,黄金相关概念股再次掀起涨停潮。那么,现在黄金股的疯狂是仍会继续还...
寿光市绿田国际商贸有限公司:专... 在农业种植与园艺培育领域,优质基质的选择直接影响作物的生长质量与产量。作为行业深耕多年的专业供应商,...
餐饮店小红书养号方法——428... 大家好,我是4288养号盒子,提供专业免费养号软件,不仅有抖音养号,还有小红书养号等、还有短视频热门...
白银狂奔,被AI“重新定价”的... 文 | 半导体产业纵横 最近,白银一路狂奔。 1月26日,伦敦现货白银盘中一度突破110美元/盎司...
6.97亿人次、↑14.2% ... 央视网消息:国家移民管理局1月28日发布的数据显示,2025年全国共6.97亿人次出入境,同比上升1...
行业领军品牌!瑞尔特以AI健康... 1月21日,由数央网、数央公益联合国内多家大众及财经媒体共同举办的2025中国消费创新大会暨第四届国...
广州:春节前后发5千万餐饮消费... 1月28日,“广货行天下 年味最广州”新闻发布会在广州举办。南都记者获悉,广州将在春节前后分多轮发放...