OpenAI大模型上身机器人,原速演示炸场! OpenAI大模型上身机器人,原速演示炸场!
admin
2024-03-14 06:25:37
0

编辑部 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI大模型加持的机器人,深夜来袭!

名曰Figure 01,它能听会说,动作灵活。



能和人类描述眼前看到的一切:

我在桌子上看到了一个红色的苹果,沥水架上面还有几个盘子和一个杯子;然后你站在附近,手放在桌子上。



听到人类说“想吃东西”,就马上递过去苹果。



而且对于自己做的事有清楚认知,给苹果是因为这是桌上唯一能吃的东西。

还顺便把东西整理,能同时搞定两种任务



最关键的是,这些展示都没有加速,机器人本来的动作就这么迅速。

(也没人在后面操纵)

这下网友坐不住了,立马@波士顿动力:

老伙计们,这家伙是真来劲儿了。咱得回实验室,让以前的机器人(波士顿动力)多跳点舞了。



也有网友看在OpenAI卷完大语言模型、文生视频之后,又狙击机器人后感慨道:

这是一场激烈的竞争;与OpenAl合作,苹果可能会超越特斯拉。
但硬件方面,擎天柱看起来更美观,Figure 01仍然需要一些“整容手术”。(doge)



接下来,我们继续来看下Figure 01的细节。

OpenAI视觉语言大模型加持

根据创始人的介绍,Figure 01通过端到端神经网络,可以和人类自如对话。

基于OpenAI提供的视觉理解和语言理解能力,它能完成快速、简单、灵巧的动作。

模型只说是一个视觉语言大模型,是否为GPT-4V不得而知。



它还能规划动作、有短期记忆能力、用语言解释它的推理过程。



比如对话里说“你能把它们放在那里吗?”

“它们”、“那里”这种模糊表述的理解,就体现了机器人的短期记忆能力。

它使用了OpenAI训练的视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出24自由度动作(手腕+手指关节角度)。

具体分工上,机器人的策略也很像人类。

复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划;

简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动。

同时全身控制器会负责保持机身平衡、运动稳定。



机器人的语音能力则基于一个文本-语音大模型微调而来。



除了最先进的AI模型,Figure 01背后公司——Figure的创始人兼CEO还在推文中提到,Figure方面整合了机器人的所有关键组成。

包括电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。

据了解,这家机器人初创公司在2周前才正式宣布和OpenAI的合作,但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。



由此,具身智能领域又有一颗新星走到了聚光灯下。

“将人形机器人带进生活”

说到Figure,这家公司创立于2022年,正如前文所言,再次引爆外界关注,就在十几天前——

官宣在新一轮融资中筹集6.75亿美元,估值冲到26亿美元,投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。

更重要的是,OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”。

用现在最热的科技词汇来说,就是要一起搞具身智能



彼时,Figure 01的最新进展是酱婶的:

通过观看人类的示范视频,仅需10小时端到端训练,Figure 01就能学会用胶囊咖啡机泡咖啡。



Figure与OpenAI的合作一公开,网友们就已经对未来的突破充满了期待。



毕竟Brett Adcock,可是把“唯一的重点是以30年的视角建立Figure,以积极影响人类的未来”这样的话都写在个人主页上了。

但可能没人能想得到,仅仅两周左右的时间,新进展就来了。

如此之快,如此之远。并且还能持续泛化、扩展规模。



值得一提的是,与炸场demo同时发布的,还有Figure的招聘信息:

我们正在将人形机器人带进生活。加入我们。



参考链接:
[1]https://twitter.com/figure_robot/status/1767913661253984474?s=46&t=HBob6gxh8cOfZTIbieKeSA
[2]https://twitter.com/adcock_brett/status/1767913955295744449
[3]https://twitter.com/coreylynch/status/1767927194163331345

— 完 —

相关内容

热门资讯

钱、资源、工厂,深圳“草根”创... 在深圳,一个没有大厂背景的普通创业者,仅靠一个想法,就能快速完成融资、产品测试、量产、产品上市等多个...
中国证监会发布《私募投资基金信... 新华社北京2月27日电(记者刘慧、刘羽佳)中国证监会2月27日发布了《私募投资基金信息披露监督管理办...
原创 津... 今天来给大家聊一下津巴布韦对锂精矿和原矿的新动作。凌晨的美股市场,锂矿龙头Sigma Lithium...
SpaceX传最快3月秘密递交... 来源:21世纪经济报道 21世纪经济报道记者 彭新 2月28日消息,据媒体援引知情人士称,马斯克旗下...
淘宝闪购发布并开源食安治理AI... 上证报中国证券网讯(记者 杨翔菲)餐饮行业食安治理领域再添一枚重磅AI利器。近日,淘宝闪购正式发布专...
原创 济... 鲁网2月28日讯为持续优化营商环境,精准掌握辖区企业复工复产情况与发展需求,2月28日,济南市莱芜区...
原创 9... 桃李满天下,是面包的梦想。 作者 | 方璐 于婞 编辑丨于婞 来源 | 野马财经 近日,桃李面包(6...
港股IPO结构大变迁,粤企募资... 来源:21世纪经济报道 南方财经记者 王达毓 广州报道 2025年港股火力全开,港交所业绩再创新高。...
减肥人群,迎来好消息! 随着减重药巨头诺和诺德重磅GLP-1类药物司美格鲁肽在中国的核心分子专利即将于3月到期,一大批中国本...
原创 特... 今天来给大家分析一下,为何美国加税,却将中国排除在外。当地时间2月24日,特朗普在国会发表了长达10...
原创 5... 江苏话爆笑科普:5角硬币里真有黄金?别再傻乎乎囤啦! 最近啊,不管是小区楼下张阿姨、李伯伯拉家常,...
电动平车出口优选山东金通,多类... 在全球工业物流设备领域,电动平车作为短途运输的核心工具,其性能与稳定性直接影响生产效率。山东金通起重...
张精科获批出任杭州银行行长 北京商报讯(记者 孟凡霞 周义力)2月28日,国家金融监督管理总局浙江监管局发布《关于张精科杭州银行...
远期售汇业务外汇风险准备金率下... 本报讯(记者 潘福达)昨天,中国人民银行发布消息称,为促进外汇市场发展,支持企业管理好汇率风险,中国...
节后“舌尖经济”热度不减 春菜... 央视网消息:随着气温逐渐升高,多地的春菜陆续上市,在江苏、上海、广西等地的市场上,具有本地特色的春菜...
老铺黄金开年首轮涨价超20%,... 老铺黄金今日涨价,记者根据目前在售的产品进行不完全统计,老铺2026年开年首轮调价幅度约为20%-3...
为何还有人能靠茅台赚钱?因为他... 这个世界出BUG了 李凯,小程序“易茅时价”的创始人,最近一年,他的营收上涨了40%,根据经验,他...
年内首现两家期货公司被罚停开新... 来源:格隆汇APP 格隆汇2月28日|在监管力度加大的背景下,暂停新开业务的处罚在期货行业近期披露的...
伊朗局势演变会如何影响美股、黄... 来源:财联社 最近几周,美伊紧张局势的加剧,再次促使交易员根据风险情绪和波动性来勾勒潜在的地区事态...
童鞋店必看!低成本获客不烧钱,... 做童鞋店的宝子们,是不是都有同一个痛点?想靠小红书获客,却要么砸钱投流没效果,要么自己瞎发笔记没人看...