谷歌拍了拍Figure说,“起来卷”
创始人
2025-06-29 02:24:37
0

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

6月28日消息,在谷歌的最新播客中,机器人在Gemini人工智能技术的加持下,未经教授就完成了一次“扣篮”动作,展现出迅速适应新场景的能力。

两天前的洛杉矶,运行着Gemini Robotics On-Device 模型的机器人还在RSS2025(机器人软件与系统大会)上完成了全球首个互动式现场展示。硅谷AI观察人士Ted Xiao表示,“它仿佛是对未来的神奇一瞥——只需与你的机器人对话,它就会做出适当的回应,并尝试执行一些合理的操作。新的物体、新的命令、新的技能。”

谷歌Gemini Robotics On-Device 模型发布于6月24日,AI 被引入了机器人,在整个过程中不需要持续的互联网连接,机器人实现了脱机工作。

谷歌在X上表示,这是自己首个“视觉-语言-动作”模型,旨在能够帮助机器人更快、更高效地适应新任务和新环境。如果我们稍加回忆,今年2月底,Figure发布的“历史上最重大的人工智能更新”——Helix也是一款用于通用人形机器人控制的“视觉-语言-动作”(VLA) 模型。

不同的是,由于谷歌家的这款模型独立于数据网络运行,它对延迟敏感的应用程序很有帮助,并确保了间歇性或零连接环境中的稳健性。

事实上,早在今年3月,谷歌就推出了第一代VLA(视觉语言动作)模型Gemini Robotics,将Gemini 2.0的多模态推理和现实世界理解带入物理世界。

而作为双臂机器人的基础模型的新选手Gemini Robotics On-Device ,除了最大限度减少计算资源需求之外,主要解决3个问题:灵巧操作、新任务的微调和适应、基于本地运行的低延迟快速推理。

官方演示视频中,这一对灵巧手不仅可以拿起一支笔,还可以相互配合拔掉笔盖。

在接下来的测试中,这一对灵巧手完成了“放置蓝色的砖块”、“拉开中间的抽屉”和“归位‘梨’模型”的任务,显示出强大的视觉、语义和行为泛化能力,并且仅仅依赖自然语言指令——“Can you close the middle drawer”?

演示之外,基础跑分数据上,Gemini Robotics On-Device也有不俗的表现。

首先是泛化能力,谷歌直接拉出了“当家花旦”——旗舰 Gemini Robotics 模型和 Previous Best On-Device模型进行比拼。结果上,Gemini Robotics On-Device虽然略低于旗舰产品的表现,但也超出之前最好的离线模型一大截。

而在分布式任务和复杂的多步骤指令方面,Gemini Robotics On-Device 模型的表现也优于其他设备端替代方案。

早在2月Figure的相关文章中就曾提到,“与受控的工业环境不同,家里堆满了无数的物品——精致的玻璃器皿、皱巴巴的衣服、散落的玩具——每件物品都有不可预测的形状、大小、颜色和纹理。为了让机器人在家庭中发挥作用,它们需要能够按需产生智能的新行为,尤其是对它们从未见过的物体。”机器人技术上的一大难题在于,举一反一简单,举一反三并不容易。

如何处理在训练样本中从未见过的任务,直接反映了机器人对新任务的适应能力。Figure家的Helix 给出的解法是使用一组神经网络权重来学习所有行为,建立了两个可以通信的“系统 1、系统 2”来分别完成“想”和“干”,而无需任何针对特定任务的微调。

而Gemini Robotics On-Device 给开发者提供了微调的选择,通过50 到 100 次演示即可快速适应新任务。微调任务的跑分如下:

在喂了Gemini Robotics On-Device 100个以内的示例之后,它展现出了如上图所示的适应能力。

谷歌还公布了这一性能的演示,并将其进一步调整到了双臂Franka FR3 机器人和Apptronik 的Apollo 人形机器人中。

在双臂 Franka 上,该模型执行通用指令,可以处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务,包括需要精确度和灵巧性的工业皮带组装任务。

在阿波罗人形机器人上同样如此,通用模型可以遵循自然语言指令,以通用的方式操控不同的物体,包括之前从未见过的物体。

对此,有网友认为,谷歌的脱机AI机器人存在改变游戏规则的可能性。

当然,也有网友并不买账。提问这和特斯拉机器人的设计有什么不同,又和ylecun在Meta所做的工作有什么不一样。

在机器人/具身智能这个赛道,各家大模型正在“八仙过海”,技术向度展现出了多样性和丰富性,但最终指向了同一个命题——如何让AI在三维物理世界建立真正的因果认知。

或许正如谷歌在技术白皮书中所写:“机器人不应是人类的模仿者,而应成为物理世界的解读者”。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

相关内容

热门资讯

天奇自动化工程股份有限公司20... 来源:上海证券报 证券代码:002009 证券简称:天奇股份 公告编号:2026-005 天奇自动...
原创 消... 贷款利率普降、监管红线收紧,曾经靠消费贷“躺着赚钱”的民营银行,正在集体调转船头,把目光瞄准小微贷市...
原创 她... 提到潘阳,很多人首先想到的便是潘长江的独女。在这位父亲的光环下成长,作为星二代的她,并没有一味地追求...
瞄准AIDC的金盘科技筹划“A... 观点网 在拿下近7亿元海外数据中心项目合同之后,金盘科技又宣布筹划港股上市。 1月27日,海南金盘智...
数字营销哪家强?盐城企业高效获... 数字营销如何破除“看不见”的困境 线上存在感弱是企业获客的首要障碍。对于盐城地区的企业而言,当潜在客...
170家融资平台有序退出,陕西... 来源:21世纪经济报道 21世纪经济报道记者 凌晨 西安报道 1月27日上午,陕西省第十四届人民代表...
国资委谈央企重组:减少行业内卷 关于央企重组最新动向,今天(1月28日),国务院国资委企业改革局局长林庆苗在国新办发布会上透露,下一...
想“金蝉脱壳”卖身美国?中国养... 吃尽中国红利,却卸磨杀驴卖身美国,商务部摁死的AI白眼狼一点都不冤 蝴蝶效应科技一家靠中国土壤扶植...
遭商誉反噬!电魂网络迎上市首亏... 深圳商报·读创客户端记者 陈琳琳 2026年1月28日,电魂网络披露《股东及董事、高管减持股份结果公...
一度突破5300美元/盎司!现... 本报(chinatimes.net.cn)记者周梦婷 北京报道 国际现货黄金价格再攀新高。1月28日...
连续三年破万亿 深圳发布未来三... 来源:21世纪经济报道 21世纪经济报道记者李金萍 深圳报道 深圳稳坐“万亿消费之城”。2025年,...
超500家A股公司年报预亏 5... 当前正值上市公司年报预告披露期,不同于以往的绩优股抢先发布业绩,今年财报季里,一批亏损公司正在密集“...
马斯克突然变卦!SpaceX准... 王爷说财经讯: 史上最大IPO来袭! 你敢信吗?那个曾经发誓“绝不上市”、把季度财报视为“地狱之火”...
两家上市公司同时公告将2025... 来源:会计雅苑 公司原审计机构立信所因审计工作人员变动和整体工作安排等综合原因, 预计无法为公司提...
2026年深圳首家A股上市企业... 深圳商报·读创客户端记者 吴素红 李丹 1月28日,深圳市恒运昌真空技术股份有限公司在上海证券交易所...
【2026最新】现货黄金交易十... 在2026年全球经济错综复杂的背景下,避险情绪再度升温,现货黄金(伦敦金)凭借其高流动性和双向交易机...
原创 2... 你或许从未留意过车灯。 汽车产业卷到白热化的今天,连最不起眼的车灯,都成了兵家必争的黄金赛道,甚至开...
原创 白... 最近的白银价格大家看了吗? 现货白银的价格已经突破了100美元一盎司了,这个价格简直太离谱了。 上个...