谷歌拍了拍Figure说,“起来卷”
创始人
2025-06-29 02:24:37
0

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

6月28日消息,在谷歌的最新播客中,机器人在Gemini人工智能技术的加持下,未经教授就完成了一次“扣篮”动作,展现出迅速适应新场景的能力。

两天前的洛杉矶,运行着Gemini Robotics On-Device 模型的机器人还在RSS2025(机器人软件与系统大会)上完成了全球首个互动式现场展示。硅谷AI观察人士Ted Xiao表示,“它仿佛是对未来的神奇一瞥——只需与你的机器人对话,它就会做出适当的回应,并尝试执行一些合理的操作。新的物体、新的命令、新的技能。”

谷歌Gemini Robotics On-Device 模型发布于6月24日,AI 被引入了机器人,在整个过程中不需要持续的互联网连接,机器人实现了脱机工作。

谷歌在X上表示,这是自己首个“视觉-语言-动作”模型,旨在能够帮助机器人更快、更高效地适应新任务和新环境。如果我们稍加回忆,今年2月底,Figure发布的“历史上最重大的人工智能更新”——Helix也是一款用于通用人形机器人控制的“视觉-语言-动作”(VLA) 模型。

不同的是,由于谷歌家的这款模型独立于数据网络运行,它对延迟敏感的应用程序很有帮助,并确保了间歇性或零连接环境中的稳健性。

事实上,早在今年3月,谷歌就推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解带入物理世界。

而作为双臂机器人的基础模型的新选手Gemini Robotics On-Device ,除了最大限度减少计算资源需求之外,主要解决3个问题:灵巧操作、新任务的微调和适应、基于本地运行的低延迟快速推理。

官方演示视频中,这一对灵巧手不仅可以拿起一支笔,还可以相互配合拔掉笔盖。

在接下来的测试中,这一对灵巧手完成了“放置蓝色的砖块”、“拉开中间的抽屉”和“归位‘梨’模型”的任务,显示出强大的视觉、语义和行为泛化能力,并且仅仅依赖自然语言指令——“Can you close the middle drawer”?

演示之外,基础跑分数据上,Gemini Robotics On-Device也有不俗的表现。

首先是泛化能力,谷歌直接拉出了“当家花旦”——旗舰 Gemini Robotics 模型和 Previous Best On-Device模型进行比拼。结果上,Gemini Robotics On-Device虽然略低于旗舰产品的表现,但也超出之前最好的离线模型一大截。

而在分布式任务和复杂的多步骤指令方面,Gemini Robotics On-Device 模型的表现也优于其他设备端替代方案。

早在2月Figure的相关文章中就曾提到,“与受控的工业环境不同,家里堆满了无数的物品——精致的玻璃器皿、皱巴巴的衣服、散落的玩具——每件物品都有不可预测的形状、大小、颜色和纹理。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。”机器人技术上的一大难题在于,举一反一简单,举一反三并不容易。

如何处理在训练样本中从未见过的任务,直接反映了机器人对新任务的适应能力。Figure家的Helix 给出的解法是使用一组神经网络权重来学习所有行为,建立了两个可以通信的“系统 1、系统 2”来分别完成“想”和“干”,而无需任何针对特定任务的微调。

而Gemini Robotics On-Device 给开发者提供了微调的选择,通过50 到 100 次演示即可快速适应新任务。微调任务的跑分如下:

在喂了Gemini Robotics On-Device 100个以内的示例之后,它展现出了如上图所示的适应能力。

谷歌还公布了这一性能的演示,并将其进一步调整到了双臂Franka FR3 机器人和Apptronik 的Apollo 人形机器人中。

在双臂 Franka 上,该模型执行通用指令,可以处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务,包括需要精确度和灵巧性的工业皮带组装任务。

在阿波罗人形机器人上同样如此,通用模型可以遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

对此,有网友认为,谷歌的脱机AI机器人存在改变游戏规则的可能性。

当然,也有网友并不买账。提问这和特斯拉机器人的设计有什么不同,又和ylecun在Meta所做的工作有什么不一样。

在机器人/具身智能这个赛道,各家大模型正在“八仙过海”,技术向度展现出了多样性和丰富性,但最终指向了同一个命题——如何让AI在三维物理世界建立真正的因果认知。

或许正如谷歌在技术白皮书中所写:“机器人不应是人类的模仿者,而应成为物理世界的解读者”。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

相关内容

热门资讯

28家企业排队,美妆IPO迎来... 沉寂三年后,美妆IPO重新热了起来。 2020年至2021年,是中国美妆企业上市的“黄金窗口”。贝泰...
原创 套... #格力第一大股东套现近 15.9 亿 #,格力电器正式发布减持结果公告,公司第一大股东珠海明骏(高瓴...
原创 昆... 6月23日,昆仑行机器人宣布,公司自2026年3月注册成立不足90天内,接连完成三轮融资,累计规模达...
心智观察所:从磷化铟的故事看中... 【文/观察者网 心智观察所 】 云南锗业的股价在2026年4月跑出了一波让人困惑的行情。 这家以锗为...
马云带着一群阿里合伙人,下田插... “马云带着一群阿里合伙人下田插秧,此次插秧团建的“同事们”阵容强大,吴泳铭、邵晓锋、蒋凡、吴泽明、蒋...
胖东来近半年累计销售额超139... 上证报中国证券网讯 6月22日晚,胖东来创始人于东来通过社交平台分享了集团近半年的经营情况。数据显示...
原创 帮... 达沃斯开幕+长川/卫星中报开门红:今天A股走“业绩提纯”,别蹭概念刀口舔血 老铁们,今天的早观察关键...
原创 腾... 原创首发 | 金角财经(ID: F-Jinjiao) 作者 | 田羽 “中国AMD”准备登陆A股了。...
于东来:胖东来拟制定夫妻或孩子... 来源:快科技 6月22日晚,胖东来创始人于东来通过个人账号“傻坏蛋于东来”透露多项员工福利升级计划。...
原创 纸... 作者 | 林洛栩 编辑 | 魏樊曦 6月18日,纸尿裤甲酰胺风波突然冲上热搜。 据《经济参考报》报道...
女子去世房贷逾期,银行起诉其子... 女子不幸去世,生前贷款57万元购买的房产开始逾期。银行将其儿子起诉至法院,提出在继承遗产范围内偿还贷...
4球-2球-4球-3球!姆巴佩... 姆巴佩距离“GOAT”还有多远?这是一个美加墨世界杯上无可避免的话题,有趣的是,这一距离似乎随着比赛...
原创 特... 文|两分钟 本文为深度观点解读,仅供交流学习 6月19日,美国总统特朗普在安德鲁斯联合基地的记者会公...
六旬老汉抱孙胳膊疼,庞继军不拍... 现代保健报讯:六十来岁的老汉,干了一辈子体力活。进了新城扶华诊所,见着庞继军就说:“我这脖子、肩膀、...
2026成都企业迎审融资:短期... 近期成都不少制造、工贸企业都卡在同一个关键节点:第三方验厂审核、银行授信、投资方现场尽调扎堆到来。但...
不断升级链博会“找朋友”模式 当“脱钩断链”的杂音不时泛起之际,第四届中国国际供应链促进博览会汇聚85个国家、地区及国际组织的67...
拼多多罕见买楼 活跃的自用型买... 观点网 全球总部也是靠租的拼多多,近期在雄安新区买了一栋办公楼。 6月21日消息,拼多多与中国电建旗...
SpaceX首发投资级债券,强... ,正在为市场对美国长端实际利率走高的判断提供新的佐证。这笔融资不仅折射出美国资本市场对超长期增长项目...