400米2分34秒破纪录!伯克利双足机器人「接管」人类 400米2分34秒破纪录!伯克利双足机器人「接管」人类
admin
2024-03-26 14:34:10
0


新智元报道

编辑:Aeneas 好困

【新智元导读】UC伯克利的双足机器人,400米直接跑进了2分34秒,这个速度属实是超越不少人类了。而背后的RL通用框架,让它无论是站立,还是跑步、跳高、跳远,动作都十分丝滑。

UC伯克利的双足机器人,跑步又破纪录了!

最近,HYBRID ROBOTICS研究团队的Cassie,给我们来了一段惊艳的表演——

以2分34秒的成绩,跑完了400米!

随后,它又在不需要额外训练的情况下,完成了1.4米的跳远。

是的,相信你已经注意到了,它的外形十分独特——只有下半身!

没错,跑步什么的,要上半身干啥。

400米冲刺脚下生风

没有腿意味着什么?当然是——速度就是一切!

一声令下,Cassie就开始跑400米了。

只见它两脚生风,脚步敏捷。

就是,不知道脚下这双跑鞋有没有速度加成?


可以看到,Cassie的跑步姿势十分标准,没有任何累赘的动作。

而研究人员则全程跟在后面陪跑。


现在,Cassie在做最后的冲刺,它集中精力一鼓作气,一跃而冲过了终点线。


它最后的成绩是——2分34秒!

这个成绩,或许已经超越了不少人类。

算起来,Cassie的步速是每分155.6米。

在21年,Cassie在中途不充电的条件下,完成了5公里的户外长跑,用时53分钟,这个步速是每分94.3米。

这个进步是肉眼可见的。

Cassie是利用神经网络强化学习进行训练的,因此,它可以从头掌握简单的技能,比如原地跳跃、向前走或跑而不摔倒。

它被孤立模仿人体动捕的数据,和动作的演示动画。

最后,团队还测试了Cassie的跳远能力,注意,这是在它没有经过额外训练的情况下。

它的成绩是1.4米。

RL通用框架,跑步、跳高、跳远多才多艺

Cassie怎么这么强?

我们在这篇发表于1月底的论文中,找到了答案。


论文地址:https://arxiv.org/pdf/2401.16889.pdf

利用深度强化学习(RL),研究者为双足机器人创建了动态运动控制器。

他们开发出了一种通用控制解决方案,可用于一系列动态双足技能,比如周期性行走,跑步,以及非周期性的跳跃和站立。


这个通用控制框架,可以实现各种周期性和非周期性的双足运动技能

基于强化学习的控制器,他们采用了新颖的双历史架构,利用了机器人的长期和短期输入/输出(I/O)历史。

当通过端到端强化学习方法进行训练时,这种控制架构在模拟和现实世界中的各种技能上,都始终优于其他方法。

另外,RL系统还引入了适应性和鲁棒性。

可以证明,通过有效利用机器人的I/O历史记录,架构就可以适应各种变化,如接触事件。


鲁棒性的另一个关键来源,就是任务随机化。

因此,我们就看到了Cassie的各种运动技能。比如稳稳地站立,多才多艺地步行,快速跑步,以及各种跳高和跳远。


这个研究所基于RL的控制器架构如下图,它利用了机器人的输入和输出(I/O)的双重历史记录。


利用这个多阶段的训练框架,就可以获得零样本转移到现实世界的通用控制策略。


如下是基于RL的双足机器人运动控制策略架构各种基线的图示。


利用研究者开发的多功能跑步策略,Cassie成功完成了400米冲刺。

这个过程是使用单一跑步策略完成的。

它使得机器人能够从站立姿势转变为平均2.15m/s和峰值3.54m/s的快速跑步步态。


使用微调的跑步策略,Cssie还以快速的跑步步态完成了100米短跑。


用训GPT的方法,训出人形机器人

机器人接管旧金山?

在今年1月,UC伯克利的人形机器人显眼包「小绿」,就曾经大规模引起了人们的注意。

那时它长这样——


看着挺好,就是没脖子。

只见它在围观人群的惊叹声中,大摇大摆地走出UC伯克利校门。


在操场草坪上,跟大爷一样练习倒步走。


身影遍布UC伯克利校园的各个角落。




甚至引起网友惊呼:机器人接管旧金山了?



预测下一个动作,控制人形机器人行走

不久后,就在2月底,UC伯克利就发表了一篇重磅论文,介绍「小绿」是怎么训练出的。


论文地址:https://arxiv.org/pdf/2402.19469.pdf

在这篇论文中,他们介绍了训练人形机器人的方法——跟训练GPT的方法是一样的。

用这种训练GPT的方法,研究者成功地训练出了人形机器人的类人运动。

重点就是:通过预测下一个动作,来控制人形机器人的行走。


人体运动作为下一个token预测

在一系列模拟轨迹上,他们对模型进行了训练。

而这些轨迹,来自之前的神经网络策略。


使用不同数据源进行训练的通用框架

人形机器人所学习的,就是基于模型的控制器、动捕数据和YouTube上的人类视频。


训练数据集的4个来源

结果,这个模型能让全尺寸的人形机器人在完全未经训练的情况下,直接完成行走!

仅仅用了27个小时的训练,模型就能在现实世界中泛化了。

而训练过程中从未见过的指令,机器人也能应对。

从此,机器人可以学习真实世界的控制任务了。

参考资料:

https://arxiv.org/abs/2402.19469

https://arxiv.org/abs/2401.16889

相关内容

热门资讯

小棉袄电商洞察:短保零食爆火背... 当整个零食赛道还在价格战的泥潭里贴身肉搏时,长沙街头的一抹红蓝撞色,正用“新鲜”二字,悄然改写着游戏...
金价高位“吞没”!美元强势+获... 汇通财经APP讯——周三(2月26日)亚市早盘,现货黄金窄幅震荡,目前交投于5150美元/盎司附近。...
大疆反击美国禁令! 据路透社报道,中国无人机制造商大疆(DJI)周二表示,已提起诉讼,对美国联邦通信委员会(FCC)禁止...
AI算力需求刺激存储芯片股 兆... 来源:财联社 财联社2月24日讯(编辑 胡家荣)受益于海外市场消息利好,港股存储概念股走强。截至发稿...
2026年中国十大杰出品牌战略... 2026年,中国经济 将 在新质生产力驱动下稳健前行, 中国 企业竞争从产品、渠道层面升级为品牌心智...
原创 特... 一直以来,中美关系始终处于紧张状态,外部局势难以化解,特朗普却在国内遭遇了前所未有的压力。2月20日...
“红利+”指数集体涨超1%,关... 截至午间收盘,中证红利指数、国证价值100指数、国证自由现金流指数均上涨1.6%。Wind数据显示,...
ETF盘中资讯|低吸时刻?科创... 或被海外AI情绪错杀,重点布局国产AI产业链的科创人工智能ETF(589520)连跌两日,场内价格现...
哈登20分米切尔23分 骑士大... 【搜狐体育战报】北京时间2月25日NBA常规赛,主场作战的骑士以109-94击败尼克斯。阿伦19分1...
科创京津冀|十二年“聚链成群”... 2026年,京津冀协同发展迎来12周年。十二年时间,足够一个产业完成从“点”到“链”的蜕变。 早在2...
金价高位震荡!实探深圳水贝市场... 2月24日,农历正月初八,深圳水贝贵金属市场在春节“不打烊”的喧嚣后,迎来了马年首个正式工作日。尽管...
日照国资内部大调整:城投集团1... 经济导报记者 杨佳琪 2月24日,日照城投集团有限公司(下称“日照城投集团”)发布关于控股股东发生变...
南京商业大佬正式入主南通这家上... 2月24日晚间,南通上市公司*ST金灵披露公司控股股东和实际控制人变更的提示性公告。 根据《重整计划...
高特电子股权合规疑云:董事牵线... 来源丨时代商业研究院 作者丨陆烁宜 编辑丨郑琳 高校教师隐秘入股、其兄牵线融资获顾问费且获得员工持股...
大市“开门红”,白酒逆市调整,... 春节假期后首个交易日,白酒走出了“逆市”行情。 2月24日,A股大盘高开并收盘企稳4100点以上,但...
别让声誉危机,成为你融资路上的... 资本市场从来没有“温情脉脉”,只有“优胜劣汰”的残酷法则。一句广为流传的警示,道尽了企业发展的隐秘风...
钨价上涨颠覆传统逻辑,APT破... 2月25日,据中钨在线最新消息,一年来,钨价的高强度和快节奏走势,已基本颠覆了原有市场传统的交易逻辑...
波兰经济学教授:美国关税政策混... 美国最高法院20日裁定美国《国际紧急经济权力法》未授权总统大规模征收关税,美国总统特朗普当天宣布将对...
暴跌54%!非洲“一哥”跌落神... 作者:曾有为 那个曾经在非洲所向披靡、被誉为“手机中的战斗机”的传奇公司,在2026年初,交出了一份...
5个月内两次更替,涪陵榨菜迎“... 瑞财经 刘治颖 2月13日,涪陵榨菜(SZ002507)公告,提名夏强伟担任公司总经理,公司董事长、...