谷歌发布Gemini 1.5,能自动识别视频中的幽默梗,目前仅面向部分用户 谷歌发布Gemini 1.5,能自动识别视频中的幽默梗,目前仅面向部分用户
admin
2024-02-16 18:49:50
0

当地时间 2 月 15 日, 推出 Gemini 1.5 Pro,其在处理大量视频、文本和图像的能力上得到增强。

2023 年 12 月, 推出 Gemini 1.0 版本,按照大小和复杂性可以分为 Nano 版、Pro 版、Ultra 版。本次新版本正是在此基础之上打造而来。

据了解,只有一部分被精选之后的开发人员和企业客户,可以使用 Gemini 1.5 Pro 的预览版。

表示,Gemini 1.5 Pro 在性能上与其之前的顶级型号 Gemini 1.0 Ultra 相匹配,但使用的计算能力较低。

至关重要的是,Gemini 1.5 Pro 模型可以处理来自用户的大量数据。虽然每个 AI 模型都有其可以消化的数据量上限,但新 Gemini 1.5 Pro 的标准版本可以处理多达 128000 个 tokens 的输入。

这些 tokens 是 AI 模型将输入分解成的单词或单词的一部分,与 GPT-4 的最佳版本(GPT-4 Turbo)相当。

目前,开发者能向 Gemini 1.5 Pro 最多提交 100 万个 tokens,这相当于大约 1 小时的视频、11 小时的音频或 700000 字的文本。毫无疑问这是一个巨大的飞跃,使得我们可以做目前其他模型无法做到的事情。

在展示的一段演示视频中,研究人员使用百万 tokens 版本向模型提供了一份 402 页的阿波罗登月任务记录。

然后,他们向 Gemini 展示了一张手绘的靴子草图,并要求它识别该图画所代表的记录中的时刻。

“这是尼尔·阿姆斯特朗(Neil Alden Armstrong)登陆月球的那一刻,”Gemini 正确地回答道,“他说,‘个人的一小步,人类的一大步。’”

这款模型还能够识别幽默时刻。当研究人员要求在阿波罗记录中找到一个有趣的时刻时,它找到了宇航员迈克·柯林斯(Mike Collins)将阿姆斯特朗称为“沙皇”(可能不是最好的台词)。

在另一次演示中,该团队上传了一部由美国默片时代演员巴斯特·基顿(Buster Keaton)主演的 44 分钟无声电影,并要求人工智能识别一张纸上的信息。

这张纸在电影中的某个时刻,会从人物的口袋中取出。不到一分钟,模型就找到了这一场景,并正确回忆出了纸上写的文字。


研究人员还重复了阿波罗实验中的类似任务,要求模型根据绘图找到电影中的场景,结果它也能完成这一任务。

表示,它对 Gemini 1.5 Pro 进行了开发大型语言模型时通常会使用的一系列测试,包括结合文本、代码、图像、音频和视频的评估。

该团队发现 Gemini 1.5 Pro 在 87% 的基准测试中优于 Gemini 1.0 Pro,并且在所有基准测试中或多或少与 Gemini 1.0 Ultra 相当,同时使用的计算能力更少。

表示,处理更大输入的能力是专家混合架构取得进展的结果。使用这种设计的人工智能将其神经网络分成多个块,只激活与手头任务相关的部分,而不是立即启动整个网络。

并不是唯一使用这种架构的公司;法国人工智能公司 发布了一个使用它的模型,据传 GPT-4 也采用了该技术。

深度学习团队负责人奥瑞尔·威亚斯()表示:“在某种程度上,它的运作方式很像我们的大脑,但并不是整个大脑一直都在激活。” 这种划分可以节省人工智能的计算能力,并且可以更快地生成响应。

艾伦人工智能研究所前技术总监奥伦·埃齐奥尼()没有参与这项工作,他说:“这种在不同模式之间来回流动并利用它来搜索和理解的流动性非常令人印象深刻。”“这是我以前从未见过的东西。”

这种可以跨模式运行的人工智能,和人类的行为方式更加相似。“人们天生就是多模式的,”说,因为我们可以毫不费力地通过在说话、写作、绘图、制表之间切换来传达想法。

然而,警告不要从事态发展中获得太多意义。“有一句著名的台词,”他说,“永远不要相信人工智能演示。”

目前尚不清楚演示视频遗漏了多少内容或从各种任务中精心挑选了多少内容(确实因其早期 Gemini 发布没有透露视频已被加速而受到批评。)

如果输入措辞稍作调整,模型也可能无法复制某些演示。表示,人工智能模型总体来说是脆弱的。

另外,此次发布的 Gemini 1.5 Pro 仅限于部分开发者和企业客户。没有具体说明何时可以进行更广泛的发布。

运营/排版:何晨龙


01/

02/

03/


05/

相关内容

热门资讯

斗金订购APP贵金属期货投资被...   斗金订购APP的投资者被广告宣传给诱导,注册就送什么现金,然后充值返现金卷等等这些宣传方式,都是...
哈易购APP非法期货交易欺骗投...   哈易购APP宣传可做白银铂金贵金属订购交易,但实际上并没有取得相关交易资质!哈易购APP本质上就...
消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...