智能体ChatGPT时刻!DeepMind通用AI向玩家进化,开始理解游戏 智能体ChatGPT时刻!DeepMind通用AI向玩家进化,开始理解游戏
admin
2024-03-14 17:15:14
0

机器之心报道

机器之心编辑部

在 AI 智能体这个领域,谷歌 DeepMind 又有了一项里程碑式研究。

视频游戏是 AI 系统的重要试验场。与现实世界一样,游戏也是丰富的学习环境,具有反应灵敏的实时设置和不断变化的目标。

从早期与雅达利游戏的合作,到人类大师级水平的《星际争霸 II》系统 AlphaStar,谷歌 DeepMind 在人工智能和游戏领域陆续推出过不少影响力研究。

刚刚,谷歌宣布了又一项里程碑式研究:SIMA(Scalable Instructable Multiworld Agent),一种适用于 3D 虚拟环境的通用 AI 智能体。

加州大学欧文分校助理教授 Roy Fox 表示,SIMA 让我们离自主智能体的「ChatGPT 时刻」又近了一步。

谷歌 DeepMind 研究工程师 Tim Harley 表示:「想象有一天,我们可以让像 SIMA 这样的智能体与你和你的朋友一起玩游戏,而不是让你与超人智能体对抗。」

但目前的 AI 系统仍然没有接近人类水平。例如,在《无人深空》游戏中,AI 智能体只能完成人类能完成的 60% 的任务。当研究人员取消人类发出 SIMA 指令的能力时,他们发现该智能体的表现比以前差了很多。

AI 已经不甘心只作 NPC 了

谷歌与八家游戏工作室合作,在九款不同的视频游戏中对 SIMA 进行了训练和测试,包括《无人天空》、《拆迁(Teardown)》、《英灵神殿》和《模拟山羊 3》。



SIMA 产品组合中的每款游戏都是全新的互动世界,包括一系列需要学习的技能,从简单的导航和菜单使用,到开采资源、驾驶飞船或制作头盔。

同时,谷歌还使用了四个研究环境 — 包括使用 Unity 构建的一个名为「建筑实验室」的新环境。在这个实验室中,智能体需要用积木搭建雕塑,以测试对物体的操作能力以及对物理世界的直观理解。

然后,谷歌在游戏组合中记录成对的人类玩家,其中一名玩家观察并指导另一名玩家,以捕获语言指令。随后让玩家自由玩游戏,重新观察他们的行为,并记录下可能导致其游戏行为的指令。

所有这些都被提供给 SIMA ,以学习预测屏幕上接下来会发生什么。通过在不同的游戏世界学习,SIMA 捕捉到了语言与游戏行为之间的联系。

「这项研究标志着首次有 AI 智能体证明自己能够理解各种游戏世界,并能像人类一样按照自然语言指令在游戏世界中执行任务。」谷歌表示。

SIMA 并不只是一个由 AI 驱动的 NPC ,而是游戏中影响结果的另一个「玩家」。

谷歌还指出,SIMA 的研究并不是为了获得高分。对于 AI 系统来说,学会玩一款视频游戏固然是技术层面的重大突破,但学会在各种游戏环境中遵从指令,可以让 AI 智能体在任何环境中发挥更大的作用。

在技术报告中,谷歌也展示了如何通过语言界面将高级 AI 模型的能力转化为现实世界中有用的行动。



技术报告:

https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

SIMA:通用 AI 智能体来了

SIMA 的组件包括预训练好的视觉模型,以及一个包含内存并输出键盘和鼠标操作的主模型,如下图所示。

具体来讲,SIMA 包含了一个专为精确图像语言映射而设计的模型和一个预测屏幕上接下来会发生什么的视频模型。谷歌根据 SIMA 产品组合中特定于 3D 设置的训练数据对这两个模型进行了微调。



下图为 SIMA 智能体架构细节。



作为一种 AI 智能体,谷歌的 SIMA 可以感知和理解各种环境,然后采取行动来实现指定的目标。

重要的是,SIMA 既不需要访问游戏的源代码,也不需要定制的 API。它只需要两个输入:屏幕上的图像以及用户提供的简单自然语言指令。SIMA 使用键盘和鼠标输出来控制游戏中的核心角色来执行这些指令。人类可以使用这个简单的界面,这意味着 SIMA 可以与任何虚拟环境进行交互。

下图为 SIMA 数据中的指令。



当前版本的 SIMA 通过 600 项基础技能进行评估,涵盖导航(例如「左转」)、对象交互(「爬梯子」)和菜单使用(「打开地图」)。



谷歌训练 SIMA 执行简单任务,大约 10 秒内就能完成。



SIMA 智能体的轨迹如下图所示。



谷歌希望未来的智能体能够处理需要高级战略规划和多个子任务才能完成的任务,例如「寻找资源和建立营地」。这是人工智能的一个重要目标,虽然大型语言模型已经演化出了能够捕获世界知识并生成规划的强大系统,但它们目前缺乏代表人类采取行动的能力。

跨游戏的强泛化能力

谷歌证明,受过多种游戏训练的智能体比仅学习如何玩一种游戏的智能体表现更好。

在谷歌的评估中,SIMA 智能体在一组九个 3D 游戏上进行了训练,其表现显著优于仅在每个单独的游戏上进行训练的所有专业智能体。

更重要的是,平均而言,接受过除一款游戏之外的所有游戏训练的智能体在这个未见过游戏上的表现几乎与专门训练过的智能体一样好。因此,这种在全新环境中发挥作用的能力凸显了 SIMA 超越其训练的泛化能力。

谷歌表示,这是一个很有潜力的初步结果,不过 SIMA 需要进行更多的研究才能在见过和未见过游戏中达到人类水平。

此外,SIMA 的性能依赖于语言。在控制测试中,智能体没有接受任何语言训练或指令,它的行为方式虽适当但漫无目的。例如,智能体可能会收集资源(这是一种常见行为),而不是按照指令去走。

谷歌评估了 SIMA 按照指令完成近 1500 个具体游戏内(in-game)任务的能力,其中部分使用了人类裁判。作为基线比较,谷歌使用环境专用 SIMA 智能体的性能(经过训练和评估以遵循单个环境中的指令)作为评估指标。

如下图所示,谷歌与三种类型的通用 SIMA 智能体进行了比较,每种智能体都经过多个环境的训练。



未来,谷歌期待在更多训练环境中进一步构建 SIMA,并纳入更强大的模型,从而提高 SIMA 对高级语言指令的理解能力以实现更复杂的目标。当然,随着 SIMA「暴露」在更多的训练世界中,谷歌希望它变得更加通用。

https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/

https://www.technologyreview.com/2024/03/13/1089764/an-ai-that-can-play-goat-simulator-is-a-step-towards-more-useful-ai/

https://www.fastcompany.com/91058360/deepmind-new-ai-agent-video-games

相关内容

热门资讯

中国银行招标结果:中国银行北京... 证券之星消息,根据天眼查APP-财产线索数据整理,中国银行股份有限公司5月24日发布《中国银行北京庄...
原创 A... "上下同欲者胜。"——《孙子兵法》 “厂家那边又逼我压两百万的货,可库存早都冒了。” 凌晨两点...
原创 “... 全款买房”和贷款30年,差别到底有多大?曹德旺一句话点醒了很多人 前阵子,一个朋友把看了半年的房子终...
云英谷科技登陆港交所:AI终端... 5月27日,云英谷科技股份有限公司(股票简称:云英谷科技,股票代码:3310.HK)成功登陆港交所主...
京东集团与三一集团签订战略合作... 5月25日,京东集团与三一集团在北京签署战略合作协议。京东集团SEC副主席、京东集团CEO许冉与三一...
青岛的朋友看过来:黄金回收我跑... 前阵子想把家里一些旧金饰处理掉,在青岛问了几家回收黄金的地方。今天就跟大家随便聊聊我打听、上门、对比...
武汉有闲置贵重金属变现需求该怎... 不少有黄金回收需求的用户不知道该如何挑选合适的服务机构,其实只要从资质、专业度、服务能力、口碑几个维...
业绩再度下滑,石药集团一季度归... 图片来源:视觉中国 蓝鲸新闻5月27日讯(记者 屠俊)5月27日午间,石药集团(01093.HK)公...
蚂蚁CEO韩歆毅:在Agent... 【CNMO科技消息】近日,蚂蚁集团CEO韩歆毅在演讲中,系统分享了关于智能体经济和AI支付的底层思考...
Buff叠满!芯片,双重利好!... 芯片领域,传来两则大消息! 一是5月27日有媒体报道称,台积电3纳米制程下半年将涨价15%,明年或再...
“全球正面临第五次油价冲击” 日本央行行长植田和男27日在东京说,自上世纪70年代以来,全球多次经历能源价格急剧上涨,当前全球正面...
白酒股,直线拉升!600779... 【导读】白酒股终于涨了 中国基金报记者 泰勒 大家好,花有重开日,人无再少年。就在刚刚,低迷许久的“...
河北地区闲置名酒如何合规变现 闲置名酒处置的行业现状 近年来随着居民酒类收藏意识的逐步提升,不少家庭都存有不同品类的年份名酒,当...
重磅!长鑫科技科创板IPO获通... 5月27日消息,长鑫科技科创板IPO获上交所上市委会议通过。
东方基金开展“一司一省一高校”... 为深入贯彻落实新“国九条”以及《推动公募基金高质量发展行动方案》的核心要求,积极响应证监会对于金融机...
那句「都是卖猪食的」,为什么你... 你大概也笑了一下。 最近有句话在网上传疯了,说字节的副总裁回怼腾讯的“短视频像猪食”,撂了一句“都是...
2026 年小红书多账号管理工... 摘要 2026 年小红书矩阵运营成品牌获客主流,但账号风控严、消息分散、转化低效等痛点突出。本文基...
打着高知女性旗号割韭菜,“五个... 出品丨搜狐财经 作者丨柴鑫洋 编辑丨李文贤 你被“五个女博士”种草过吗? 打着高知女性旗号,却做着低...
A股董责险渗透率破32%,海南... 开栏语: 保险是经济的“减震器”,但保险条款复杂晦涩,犹如海下暗礁。 即日起,海财经·证券导报开设“...
奥尼电子:49万股限制性股票将... 5月27日,奥尼电子(301189)发布公告,2025年限制性股票激励计划第一个归属期归属结果已确定...