Karpathy盛赞「环境中心」!AGI最后一块拼图开源,大厂豪掷百万锁死
创始人
2025-08-31 01:28:08
0

新智元报道

编辑:桃子 艾伦

【新智元导读】强化学习核心是什么?Karpathy一语道破——环境。全新开源Environments Hub横空出世,为强化学习训练带去革命性突破。

强化学习时代,什么最重要?

Karpathy给出了答案,环境!只有环境,才能让LLM真正进行交互、执行动作、观察结果。

如今,一个开源的环境中心——Environments Hub正式登场了,它由一家专注于去中心化AI开发公司Prime Intellect发布。

一直以来,RL环境是割裂的、封闭的,甚至难以共享。

但有且只有环境,定义了世界、规则,以及「状态—动作—奖励」的反馈闭环。

从游戏到编程,再到聊天对话,它们是AI学习发生的场景。没有它们,RL只是一套无从着力的算法。

Environments Hub的诞生,能够让任何人模拟出各种各样、高质量的环境,为开源AGI做出贡献。

AI智能体交互,缺的是环境

RL环境,是智能体学习的试验场。

回想一下,在预训练时代,互联网数据是核心。LLM主要通过大量多样,且高质量的数据来学习。

到了监督微调阶段,重点变成了「对话数据」。

人们会雇佣外包团队,来为问题创建答案,类似Stack Overflow、Quora平台的模式,但又专为LLM使用场景而设计。

如今到了强化学习时代,前两个阶段不会消失,但不同的是,环境成为了重心。

这些环境,可以用于模型训练,也可用于评估。不过,问题在于,如何创建出丰富多样的环境?

Karpathy回忆道,OpenAI最早的一个项目Gym,一个希望用统一框架去构建大规模环境集合。

GitHub地址:https://github.com/openai/gym

不过,这都是近十年前,大模型还未兴起的项目了。所以,当时的环境,都是一些简单的经典控制任务,比如cartpole、ATARI之类的。

而现在,Environments Hub是一个专门针对LLM构建的版本。

Karpathy激动地表示,「这是个非常棒的努力和想法」。今年初,他还发文建议过有人应该做类似的事情。

Environments Hub有个特点,一旦框架构建完成,原则上社区和行业就可以在不同领域并行开发。

而且,环境和智能体交互的方向,是下一个未来。

大厂斥资几百万,搞出围墙花园

为什么需要打造一个Environments Hub呢?

目前,多数强化学习环境是由初创公司构建,并将其出售给少数几家不对外开放的大型实验室。

如果高质量的学习环境一直保持封闭且昂贵,开源模型将进一步落后于闭源模型。

要想扭转这种局势,需要有一个强大的开源学习环境和训练工具生态系统能崛起。

Environments Hub正是承载着这个使命应运而生,旨在让下一波初创公司和AI的发展能够构建于开放的基础设施和开源模型之上。

核心功能,一键生成评估报告

总结来说,Environments Hub具备了以下功能亮点:

  • 通过Hub或CLI(命令行)拉取、推送并管理环境

  • 生成跨模型的评测报告

  • 与verifiers框架深度集成

  • prime-rl训练器原生支持环境

  • 提供用于代码执行的原生沙箱支持

你可以创建、管理和共享用于强化学习及评估的环境:

可以为不同模型创建和浏览环境评估报告:

可扩展训练器prime-rl原生支持这些环境:

还有沙盒功能,可直接与Verifier Environments对接,以实现安全的代码执行。

如果还有你需求的功能没有满足,你也可以亲自作为该开源项目开发者去贡献代码。

下一步:全栈式开源AGI基础设施

过去几个月中,Environments Hub将基于Agent的强化学习训练扩展到规模最大的开源模型,并取得了显著进展。

随着众多众包环境被引入INTELLECT-3,训练出一个完全开放、最先进的Agent模型将成为可能。

除此之外,Environments Hub关心的重点是,让人人都能用上这套基础设施,使研究人员和初创公司都能为自己的任务训练模型、集成工具、运行强化微调,以及优化Agent支撑框架。

prime-rl的整个技术栈都是开源的,正在扩展到全球的计算资源上无缝运行。

强化学习不仅是通往AGI的必经之路,也是构建AI原生产品的基础。

未来最成功的初创公司,将是那些能根据自身需求,创造出差异化环境的公司。

如今,最大的障碍并非获取强大模型,而在于大规模训练和部署它们所需的基础设施及成本。

通过降低这一门槛,Environments Hub旨在为所有AI构建者提供廉价、无缝的计算、推理和训练资源,以及全套的强化学习基础设施。

参考资料

https://www.primeintellect.ai/blog/environments

相关内容

热门资讯

成都一小学强制教师参与年会表演... 1月25日,成都市锦江区教育局发布情况通报: 近日,接群众投诉成都师范附属小学慧源校区存在“强制教师...
时隔半年,德国议员再提撤回存放... 据CCTV国际时讯援引德国媒体1月23日报道,德国议员施特拉克-齐默尔曼呼吁德国联邦政府将存放在美国...
双汇、唐人神、雪川上新;牧原股... 双汇中式卤味“卤福斋”上市 牧原股份最快2月份在香港上市 正大2026将在中国养小棚虾 1.双汇中式...
上交所对出版传媒、关联方宽甸新... 上交所发布关于对北方联合出版传媒(集团)股份有限公司、关联方宽甸满族自治县新华书店有限公司及有关责任...
原创 2... 2025年中国区域经济的最新画卷徐徐展开,21个省份的经济成绩单已新鲜出炉。透过这些跃动的数字,我们...
原创 马... 近日一则消息震惊全球财富圈,据《财联社》等媒体1月20日的报道:马斯克凭借旗下xAI公司的最新一轮融...
白羽鸡海外引种“断供” 国产种... 图虫创意/供图 证券时报记者 黄翔 2026年伊始,一场由海外禽流感引发的产业震荡,波及我国白羽肉...
Vitalik 谈为什么去中心... 来源:市场资讯 (来源:吴说) 在吴说主持的推特 space 中,Vitalik 表示,很多 Cry...
2026年跨境电商财税合规品牌... 随着全球数字经济深化与各国税务监管趋严,跨境电商行业已步入“合规驱动增长”的新阶段。2026年,财税...
海目星涨8.71%,成交额11... 来源:新浪证券-红岸工作室 1月23日,海目星涨8.71%,成交额11.34亿元,换手率6.89%,...
中国黄金涨停,成交额13.20... 来源:新浪证券-红岸工作室 1月23日,中国黄金涨停,成交额13.20亿元,换手率8.70%,总市值...
昙花一现!死了么APP关联公司... 最近“死了么”APP这瓜是越吃越有意思。 1月23日消息,日前月境(郑州)技术服务有限公司因通过登记...
华神科技拟定增募资不超过4.5... 本报记者 舒娅疆 1月24日,成都华神科技集团股份有限公司(以下简称“华神科技”)披露2026年度向...
下调!进入“0”字头时代! 近期,多家国有银行及部分股份制银行进行了新一轮的存款利率下调。调整后,国有六大行的定期存款整存整取一...
每周股票复盘:瑞丰银行(601... 截至2026年1月23日收盘,瑞丰银行(601528)报收于5.49元,较上周的5.42元上涨1.2...
公募基金业绩“参照系”将全面升... 【大河财立方消息】为落实《推动公募基金高质量发展行动方案》,坚持以投资者为本,规范公募基金业绩比较基...
杰美特:关于回购注销部分限制性... 证券日报网讯 1月23日,杰美特发布公告称,公司于2026年1月22日召开第四届董事会第二十五次会议...
300391,将退市!4连20... 1月23日晚,*ST长药(300391)发布公告,公司于1月23日收到深交所下发的《事先告知书》,拟...
ChatGPT也开始内测广告,... 手机屏幕的光映在脸上,一位美国网民随口问ChatGPT今晚吃什么,答案的末尾却静静躺着一个“赞助”链...
酒厂倒闭潮,谁在为这场“去泡沫... 你家附近的烟酒店,最近是不是贴上了“旺铺转让”? 2025年一年,全国消失了32万家烟酒店,平均每天...