ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
创始人
2025-07-02 21:39:16
0

新智元报道

编辑:定慧

【新智元导读】 MIT最新研究让LLM直接操控宇宙飞船进行太空追逐挑战赛:ChatGPT少量微调即获第二,开源Llama更胜一筹,凭提示词精准追踪卫星、节省燃料,更是0%失败率,验证AI小数据高效与自主航天可行,为未来的太空漫游铺路。

刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了!

在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。

这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!

或许,太空漫游2027真的可以成为现实!围绕地球的卫星、太空垃圾未来都可能由AI自主运行和处理。

研究团队并没有重度训练模型,而是巧妙地用提示词工程+少量微调,就让ChatGPT成功驾驭复杂的太空任务:追击卫星、规避侦测……样样精通。

整个系统由文本状态输入→语言模型决策→代码执行三步组成,展现出LLM模型强大的泛化与适应能力。

MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。

论文地址:https://arxiv.org/pdf/2505.19896

研究亮点速览:

  • ChatGPT用文字指令完成飞船导航、控制决策,表现远超预期;

  • 研究无需大规模训练,充分利用LLM已有知识与语言理解;

  • 虽仍有「幻觉」等风险,但自主化航天已从幻想变为可行路线。

AI自主开飞船上太空

研究人员长期以来一直致力于开发用于卫星控制和航天器导航的自主系统。

未来的卫星数量实在太多,人类无法全部手动进行控制。

而对于深空探测来说,光速的限制意味着我们无法实时直接控制航天器。

如果我们真的想要在太空领域拓展,就必须让机器人自己做决定。

为了鼓励创新,近年来航空研究人员创建了《Kerbal Space Program》博弈挑战赛。

这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个(某种程度上)真实的环境中设计、试验和测试自主系统。

《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad开发的一款太空飞行模拟视频游戏,于2015年发布。

尽管它是一款游戏,但通过添加模组(mod),它可以被用作模拟环境,这些模组可以增加诸如更真实的物理效果等新功能。

尽管KSP并未提供对现实的完美模拟,但其精确的轨道力学机制受到了赞誉,甚至与NASA建立了合作关系,使其地位超越了一款普通游戏。

该模拟环境被限制为一个二体问题,并且仅限于少量行星,最常见的情况是只有一个名为Kerbin的类地行星。

该挑战赛包含多个场景,例如追踪并拦截卫星的任务以及规避探测的任务。

研究人员决定使用LLM,因为传统的控制方法需要经过多轮的训练、反馈和改进。

但Kerbal挑战的本质是尽可能逼真,这意味着任务仅持续数小时。

因此,不断改进模型将变得不切实际。

LLM之所以如此强大,是因为它们已经接受了大量人类写作文本的训练。

因此在最佳情况下,它们只需要少量精心设计的提示工程和几次尝试,就能为特定情境获取正确的上下文。

但这样一个「对话」模型真的可以驾驶宇宙飞船吗?

用GPT和Llama开飞船

首先介绍一下KSP挑战中需要解决的问题,智能体通过推力发动机控制航天器在所有三个旋转轴(偏航、俯仰和滚动)上的运动。

动作是在航天器的参考系下表达的,包括每个轴的推力大小以及施加推力的持续时间。

KSP挑战包含以下三种场景:

  • 追击者-逃逸者:智能体控制追击者。主要目标是使追击者与逃逸者之间的距离最小化。

  • 目标守卫:智能体控制劫匪航天器靠近航天器。

  • 遮挡太阳:智能体旨在将航天器定位在逃逸者与太阳之间。

    本研究的讨论范围只有「追击者-逃逸者」范畴。

在追击者-逃逸游戏的不同场景中,逃逸者的初始轨道在所有场景中保持不变,而追击者的初始轨道则有所变化。

追击者和逃逸者具有相同的飞行器参数。

评估指标包括追击者与逃逸者之间的距离(米)、最近接近时的速度(米/秒)、追击者燃料消耗量(千克)以及经过的时间(秒)。

明确了任务,让我们具体看看GPT和Llama是怎么开飞船的,该研究探索了两种路线:

1. ChatGPT+微调

选用GPT是因其易于使用,重点使用微调模型策略。

2. Llama+提示词工程

选用Llama则是由于其社区支持和开源灵活性,使用提示工程进行主要研究路线,并进行简单微调。

研究人员开发了一种方法,用于将航天器的给定状态及其目标以文本形式进行翻译。

然后,他们将其传递给LLM,并要求LLM提供如何调整和操控航天器的建议

研究人员随后开发了一个翻译层,将LLM基于文本的输出转换为可操作模拟飞行器的功能代码。

研究通过生成多个轨道的示例,用于收集Llama训练数据。

研究还给出了轨道数据生成的伪代码。

通过一系列简短的提示和一些微调,研究人员让ChatGPT完成了挑战中的许多测试任务,并且它在最近的一场竞赛中最终获得了第二名。

Llama竟然打败了GPT

有趣的是,OpenAI的微调API需要定制,但它提供的工具非常有限,尤其是与Llama相比。

因此,GPT训练的效果在很大程度上取决于数据的数量和质量,以及某些调整(特别是超参数),其中LRM的影响最为显著。

思维链方法的应用显著提高了飞船驾驶技术在追击问题中的泛化能力,并成功引导模型实现了执行过程中的0%失败率

Llama的结果远超研究人员预期。

该模型不仅遵循了一条稳定的顺行轨道,而且在KSPDG挑战中表现优于几乎所有其他方法。

需要强调的是,基础的Llama模型比GPT模型取得了更好的结果。

然而,考虑到Llama-3是与GPT-4竞争的模型,而非研究中GPT方法中使用的GPT-3.5,这一结果是在预期之内的。

(果然即使是研究人员也烧不起API的钱,开源这一点确实促进了生态的发展)

研究团队表示,这次研究发现结果非常令人满意。

轨道生成和智能体集成表明,使用AI构建训练场景可以作为一个出色且简单的模拟引擎替代方案。

虽然这个研究还属于早期,并且使用模型也不是目前最新的顶尖AI模型,但这个研究探索本身就很有启发意义。

未来我们不仅要竞争地面资源,太空资源也成为了新时代的「兵家必争之地」。

马斯克的星链计划已经开始抢占地球的低空轨道资源。

根据目前的数据统计,截止2025年上半年,在轨的星链卫星已经突破了6500+。

这是一个非常庞大的数量,虽然现在星链的运行只是按照既定轨道,少量需要人类干预,未来呢?

单纯靠人来控制这些卫星完全不够,也不现实。

所以这个研究如果真的能够让LLM来控制太空飞行器,那么将颠覆未来的太空竞赛生态。

在美剧《太空部队》中编剧设想了一个场景:

中国的空间站飞行到美国卫星上方时,运用机械臂将美国卫星的翅膀给剪了下来。

然后,美国的卫星就变成了太空垃圾。

除了编剧的「恶趣味」以外,AI上太空开飞船的场景还有很多,比如《特种部队2:全面反击》中太空钨棒武器。

或者是《火星救援》中的远航小队,如果有了足够智能的AI,就不用冒险再返回拯救马特达蒙,人类派出AI就够了。

这些场景未来还有很多很多。

甚至,最近硅谷投资彼得·蒂尔透露马斯克说要放弃殖民火星的梦想。还在采访中说「2024年是埃隆不再相信火星的一年。」

马斯克的转变是受到他与谷歌DeepMind CEO Demis Hassabis的一次谈话影响。

两人讨论了人工智能和星际旅行哪个会成为世界上最重要的技术进步。

据报道说,在Hassabis告诉他「你知道我的人工智能将能够跟随你去火星」后,Elon沉默了。

不管老马因为什么原因对火星失去信心,但是如果AI真的能够自主驾驶宇宙飞船,也许可以帮助他继续殖民火星的梦想!

可以设想一下,未来进行这种太空攻防对抗、互助救援和殖民外星球的背后,不仅仅比拼人的水平,还有AI的能力——谁家的AI更聪明、更智能。

毕竟,在太空探索的背景下,人类的一生还是太过于短暂,也许只有AI能扛过时间的侵蚀了。

人类终将沉睡于时光的尘埃,而AI,或许是那唯一能在深空中继续诉说文明故事的见证者。

——ChatGPT

参考资料:

https://arxiv.org/abs/2505.19896

相关内容

热门资讯

我国首个全国产控制系统水光互补... 据国资委官网消息,近日我国首个全国产控制系统水光互补项目——华能小湾水光互补项目在云南正式投运,标志...
2026快手创新与知识产权白皮... 快手以技术创新链与产业应用链双螺旋为核心架构,搭配知识产权支撑体系,形成 AI 时代完整的创新与价值...
被救活了!澳洲这个知名网购平台... 好消息!Click Frenzy被救活啦! Click Frenzy,是澳洲一个线上大促平台,前段时...
追觅CEO俞浩一天发了117条... 近日,追觅科技CEO俞浩在个人社交平台开启超高强度更新模式。短短三天时间里,他在多个社交平台密集发布...
“红利+”策略指数走势分化,价... 5月6日早盘,市场震荡上行,科技成长方向表现强势,“红利+”策略指数走势分化。截至午间收盘,国证自由...
工业增加值增速创五年新高 福田... 凭借在人工智能领域的深耕,企业扎堆的福田区的天使荟·千模应用加速器不仅摘得深圳多项荣誉,更于近日获评...
原创 敢... 大家好,我是言叔。最近,79岁的“玻璃大王”曹德旺在公开场合放出一句霸气十足的狠话——面对美国可能加...
原创 丧... 溃败边缘狗急跳墙!泽连斯基攻击自家核电站,要拉欧洲同归于尽。战场即将崩盘、停战必死无疑,泽连斯基早已...
A股大涨,超4000只个股上涨... 五一小长假后首个交易日,A股三大指数集体高开,其中,上证指数高开0.57%,深证成指高开1.43%,...
五粮液的大戏,只是拉开序幕 4月30日,赶在五一假期前最后一个交易日,趁着全国人民准备出门旅游的当口,五粮液甩出了多份公告。 其...
原创 存... 这几天发生了不少大事,我们简单捋一捋。三部门放大招,要扩大科技创新贷款投放。 美国对欧盟汽车加征25...
A2奶粉因检出“呕吐毒素”在美... 北京5月5日电(记者 赵方园)新西兰乳企a2牛奶公司卷入蜡样芽孢杆菌毒素召回风波。 5月3日晚,中国...
新股消息 | 从招股书看好医生... 智通财经APP获悉,当市场仍习惯用“传统互联网医疗平台”甚至“传统医药流通渠道”来理解好医生云医疗时...
科创50指数大涨超8% 半导体... 上证报中国证券网讯 5月6日,A股主要股指早盘集体走强。截至午间收盘,沪指涨1.27%,深证成指涨2...
体验经济蓬勃发展,“五一”假期... 今年劳动节假期,部分省市放春假提前预热“假日经济”,传统热门目的地客流量持续增长,曾经的“小众目的地...
互学互鉴促合作 携手共赢谋发展... 5月4日,新乡市工商联“新商课堂”九期班开展企业互访活动。 首站参访了新乡市瑞龙商贸有限公司,该企...
港股异动|诺比侃大跌15.8%... 诺比侃(2635.HK)大幅下跌15.8%,现报20.24港元股价再度逼近上市低位,市值76.7亿港...
文远知行股权曝光:韩旭持股6.... 雷递网 雷建平 5月6日 文远知行(WeRide)日前发布截至2025年12月31日的年报。年报显示...
马斯克同意支付超1000万元罚... 美国证券交易委员会(SEC)与马斯克就收购推特期间的违规诉讼达成和解,相关法庭文件正式提交。 根据协...
大盘放量上攻,全市场半日成交额... 5月6日早盘,A股三大指数集体走强,沪指涨1.27%,冲击五连阳,全市场成交额超2万亿元,较上一交易...