谷歌拍了拍Figure说,“起来卷”
创始人
2025-06-29 02:24:37
0

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

6月28日消息,在谷歌的最新播客中,机器人在Gemini人工智能技术的加持下,未经教授就完成了一次“扣篮”动作,展现出迅速适应新场景的能力。

两天前的洛杉矶,运行着Gemini Robotics On-Device 模型的机器人还在RSS2025(机器人软件与系统大会)上完成了全球首个互动式现场展示。硅谷AI观察人士Ted Xiao表示,“它仿佛是对未来的神奇一瞥——只需与你的机器人对话,它就会做出适当的回应,并尝试执行一些合理的操作。新的物体、新的命令、新的技能。”

谷歌Gemini Robotics On-Device 模型发布于6月24日,AI 被引入了机器人,在整个过程中不需要持续的互联网连接,机器人实现了脱机工作。

谷歌在X上表示,这是自己首个“视觉-语言-动作”模型,旨在能够帮助机器人更快、更高效地适应新任务和新环境。如果我们稍加回忆,今年2月底,Figure发布的“历史上最重大的人工智能更新”——Helix也是一款用于通用人形机器人控制的“视觉-语言-动作”(VLA) 模型。

不同的是,由于谷歌家的这款模型独立于数据网络运行,它对延迟敏感的应用程序很有帮助,并确保了间歇性或零连接环境中的稳健性。

事实上,早在今年3月,谷歌就推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解带入物理世界。

而作为双臂机器人的基础模型的新选手Gemini Robotics On-Device ,除了最大限度减少计算资源需求之外,主要解决3个问题:灵巧操作、新任务的微调和适应、基于本地运行的低延迟快速推理。

官方演示视频中,这一对灵巧手不仅可以拿起一支笔,还可以相互配合拔掉笔盖。

在接下来的测试中,这一对灵巧手完成了“放置蓝色的砖块”、“拉开中间的抽屉”和“归位‘梨’模型”的任务,显示出强大的视觉、语义和行为泛化能力,并且仅仅依赖自然语言指令——“Can you close the middle drawer”?

演示之外,基础跑分数据上,Gemini Robotics On-Device也有不俗的表现。

首先是泛化能力,谷歌直接拉出了“当家花旦”——旗舰 Gemini Robotics 模型和 Previous Best On-Device模型进行比拼。结果上,Gemini Robotics On-Device虽然略低于旗舰产品的表现,但也超出之前最好的离线模型一大截。

而在分布式任务和复杂的多步骤指令方面,Gemini Robotics On-Device 模型的表现也优于其他设备端替代方案。

早在2月Figure的相关文章中就曾提到,“与受控的工业环境不同,家里堆满了无数的物品——精致的玻璃器皿、皱巴巴的衣服、散落的玩具——每件物品都有不可预测的形状、大小、颜色和纹理。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。”机器人技术上的一大难题在于,举一反一简单,举一反三并不容易。

如何处理在训练样本中从未见过的任务,直接反映了机器人对新任务的适应能力。Figure家的Helix 给出的解法是使用一组神经网络权重来学习所有行为,建立了两个可以通信的“系统 1、系统 2”来分别完成“想”和“干”,而无需任何针对特定任务的微调。

而Gemini Robotics On-Device 给开发者提供了微调的选择,通过50 到 100 次演示即可快速适应新任务。微调任务的跑分如下:

在喂了Gemini Robotics On-Device 100个以内的示例之后,它展现出了如上图所示的适应能力。

谷歌还公布了这一性能的演示,并将其进一步调整到了双臂Franka FR3 机器人和Apptronik 的Apollo 人形机器人中。

在双臂 Franka 上,该模型执行通用指令,可以处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务,包括需要精确度和灵巧性的工业皮带组装任务。

在阿波罗人形机器人上同样如此,通用模型可以遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

对此,有网友认为,谷歌的脱机AI机器人存在改变游戏规则的可能性。

当然,也有网友并不买账。提问这和特斯拉机器人的设计有什么不同,又和ylecun在Meta所做的工作有什么不一样。

在机器人/具身智能这个赛道,各家大模型正在“八仙过海”,技术向度展现出了多样性和丰富性,但最终指向了同一个命题——如何让AI在三维物理世界建立真正的因果认知。

或许正如谷歌在技术白皮书中所写:“机器人不应是人类的模仿者,而应成为物理世界的解读者”。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

相关内容

热门资讯

【ESG动态】天和防务(300... 日前,华证指数公布了新一期(2025年4月30日)的ESG评级结果,天和防务(300397.SZ)获...
全市突破1000家! 据国家税务总局深圳市税务局消息 深圳离境退税正式上线电子退付渠道 全球入境旅客在深消费后 使用支付宝...
刚刚宣布:存在倾销,征收反倾销... 来源:商务部网站 商务部:对原产于欧盟的进口相关白兰地征收反倾销税 7月4日,商务部发布年度第34号...
格力不卷价格卷技术!格力市场总... (图片来源:摄图网) 近日,在2025中国企业出海高峰论坛上,格力电器市场总监朱磊一番发言引发行业热...
原创 距... 总有一天,14亿国人也能够过上美国人那样的消费生活,听起来这像是天方夜谭,但实际上近在咫尺。 对...
生物制品板块7月4日涨0.61... 证券之星消息,7月4日生物制品板块较上一交易日上涨0.61%,神州细胞领涨。当日上证指数报收于347...
充电宝召回引发倒闭?罗马仕回应... wumiancaijing.com / 最热的泛财经新闻,都在这儿了。 重要提醒!!!为防失联,请“...
21书评|揭开货币政策迷雾与全... 文/何平 我是抱着学习的态度来翻译《货币之手》的。这本书的原名叫《神秘之手》,恰好符合我作为一名货币...
反洗钱监管加码 10万元现金买... 为预防洗钱和恐怖融资活动,遏制洗钱及相关犯罪,加强和规范贵金属和宝石从业机构反洗钱和反恐怖融资工作,...
原创 必... 最近,许多欧盟企业面临稀土资源不足的问题,尤其是在制造业的供应链中,稀土的短缺已经带来巨大的困扰。在...
金电科技赴美上市,看玩具品牌如... 当前玩具市场竞争十分激烈国内外玩具相关企业已超过数千万家,其中除了玩具巨头之外还有许多中小玩具品牌,...
生育补贴政策:年内落地可期,助... 冀时007消息:2025年政府工作报告提出“制定促进生育政策,发放育儿补贴”,这一举措引发广泛关注。...
7月4日海利得跌6.67%,光... 证券之星消息,7月4日海 利 得(002206)跌6.67%,收盘报5.46元,换手率14.36%,...
7月4日连板股分析:连板股晋级... 【7月4日连板股分析:连板股晋级率仅二成 银行板块全天走强】今日共39股涨停,连板股总数10只,其中...
今年第二批IPO现场检查名单公... 2025年第二批IPO现场检查名单出炉,12家公司被抽中。 7月3日,中国证券业协会(下称“中证协”...
上半年上海“即买即退”销售额同... 从2015年7月1日首位游客“尝鲜”沪上境外旅客购物离境退税政策,到如今升级“全市退付”、引入自助开...
董明珠15年来首次掉出《财富》... 红星资本局7月4日消息,近日,《财富》发布了2025年中国最具影响力的商界女性榜单(Most Pow...
A股午后冲高回落,三大股指涨跌... 李晶昀 AI图 A股三大股指7月4日开盘涨跌互现。早盘在银行股走强带动下,沪指震荡走高,并带动深成指...
开屏消费观|柠檬价格狂飙!网友... 对很多人来说,夏天是柠檬味的,燥热难耐时,一杯清爽解腻的柠檬水能带走不少疲惫与不适。进入盛夏,从水果...