提升AI智能体工作流的速度与能效
创始人
2026-06-26 12:22:13
0

智能体工作流是一种由AI驱动的软件系统,它通过串联多个模型与外部工具来处理复杂任务,例如分析视频并回答相关问题。

然而,这类高度分散化系统在设计和部署方式上往往存在效率问题,导致算力、能源和成本的浪费。

为了提升效率,麻省理工学院与微软的研究人员联合开发了一套智能系统,旨在简化智能体工作流的设计流程,并自动优化工作流的执行方式。

借助这一新方法,开发者只需用自然语言描述希望工作流实现的功能,无需提前逐一指定应用的所有技术细节。

系统会自动确定最适合的模型与工具,并在云服务商执行工作流时,自动配置最优的硬件方案和算力资源分配策略。

同时,系统会根据每位用户的优先需求——例如降低成本或提升速度——动态调整配置方案。

在多项智能体工作负载测试中,与传统方法相比,这套新系统在不影响性能的前提下,显著减少了部署所需的计算单元数量,大幅降低了能耗与成本。

"智能体工作流正变得越来越复杂,并迅速成为云服务商业务的核心支撑。能源消耗是一个重大问题,因此我们必须高度关注工作流的效率。资源过度分配极易发生,进而造成能源和资金的浪费。让云服务商能够智能地优化这些工作流的资源利用,对所有相关方来说都是一件好事。"论文第一作者、麻省理工学院电气工程与计算机科学系博士生 Gohar Chaudhry 表示。

论文的其他作者包括:麻省理工学院电气工程与计算机科学系副教授、MIT计算机科学与人工智能实验室成员 Adam Belay,以及微软Azure技术研究员兼公司副总裁、通讯作者 Ricardo Bianchini 等来自微软Azure的研究人员。该论文将在USENIX操作系统设计与实现研讨会上正式发表。

配置难题

智能体工作流是由多个自主AI智能体协同构成的系统,这些智能体通过调用各类模型与工具(如数据库或Python程序),动态完成数据处理、代码生成等多步骤任务。

这类工作流通常作为后台进程,为面向用户的应用程序提供支撑。

传统做法要求开发者在开发阶段就将所有技术选型硬编码固定。他们需要明确选用哪些AI智能体、模型和工具,以及调用顺序,还需指定运行工作流的硬件配置,并在速度与成本等方面进行权衡。

这一过程尤为复杂,因为智能体工作流往往整合了多个黑盒模型和各类工具,每个组件都有各自的配置选项,而这些组件可能来自不同的厂商。

一旦有新的AI模型发布,可以提升应用的精度或效率,开发者就不得不推倒重来。

"即便你想手动完成所有配置,也很难达到最优效果,因为可能的配置空间实在太大了。"Chaudhry 说。

此外,为用户部署应用的云数据中心无法深入工作流内部,也就难以在用户发起请求时以最高效的方式分配硬件资源。

为此,研究团队开发了这套名为 Murakkab 的新系统——这是一个乌尔都语词汇,意为"多种事物的组合"——旨在对整个智能体工作流进行全面优化。

动态决策机制

首先,Murakkab 允许开发者以高层次的语言描述应用意图来创建智能体工作流,而无需详细说明工作流各组件的具体组合方式。

例如,开发者可以描述一个视频问答应用,该应用需提取关键帧、生成文字记录,并回答用户关于视频内容的问题。

"实现这一目标的方式有很多,而不同的模型和工具选择,都会影响应用完成任务的速度。"他说。

Murakkab 会根据开发者的简单描述,自动识别并整合最合适的现有模型与工具,构建完整的工作流。

系统还会判断哪些组件需要顺序执行,哪些可以并行处理,以提升整体性能。

"该平台会随时间动态调整配置决策,因此即使明天出现了新的模型或GPU加速器,开发者也无需为此担心。"他说。

当云服务商为用户部署该应用时,Murakkab 会根据用户的约束条件(如在满足延迟要求的前提下优先保障精度)对工作流进行优化,实时动态识别最优硬件分配方案和部署计划,最终生成可供云服务商直接执行的工作流。

"我们的系统还为云服务商提供了跨多个工作负载的可视化能力,使其能够在满足用户约束的前提下,以最高效的方式共享计算资源。"他说。

在针对视频问答和代码生成等多样化智能体工作流的测试中,Murakkab 在满足用户需求的同时,仅需其他方法约35%的计算量,能耗约为27%,成本不足25%。

Murakkab 的动态特性还赋予用户灵活权衡各项指标的能力。在一个测试案例中,系统将某智能体工作流的能耗降低了逾一个数量级,而精度仅下降约2%。

系统还为视频帧选取模型找到了一种出乎意料的最优配置,显著提升了视频问答任务的性能。Chaudhry 表示,这类优化几乎不可能由开发者手动实现。

下一步,研究团队计划将系统扩展至更复杂的工作流和更大规模的计算集群,并探索优化新型智能体应用的可能性。

"让这些工作流更加资源高效、大幅降低能耗的潜力是巨大的,但我们需要从大型云平台的规模来思考这个问题。"Chaudhry 说。

本研究部分获得半导体研究公司及美国国防高级研究计划局的资助支持。

Q&A

Q1:Murakkab系统是什么?它能解决什么问题?

A:Murakkab 是由麻省理工学院与微软联合开发的智能系统,名称来源于乌尔都语,意为"多种事物的组合"。它能自动优化AI智能体工作流的设计与执行,解决传统方式中资源过度分配、配置复杂繁琐、能耗和成本浪费等问题。开发者只需用自然语言描述需求,系统即可自动完成模型选择、硬件配置和资源调度。

Q2:Murakkab在实际测试中表现如何?

A:在视频问答和代码生成等多种智能体工作流测试中,Murakkab 仅需传统方法约35%的计算量,能耗约为27%,成本不足25%,同时不影响整体性能。在一个具体案例中,系统将工作流能耗降低了逾一个数量级,而精度仅下降约2%。

Q3:Murakkab如何应对新模型或新硬件的出现?

A:Murakkab 采用动态决策机制,能够持续跟踪并自动整合最新的模型和GPU加速器,开发者无需重新配置工作流。系统会实时根据用户的优先需求调整配置,确保工作流始终以最优状态运行,从而避免了传统方式中每次更新都需从头开发的问题。

相关内容

热门资讯

黄金“不灵了”,高端金饰的溢价... 古法黄金到底能不能走出脱离金价波动的独立溢价 作者:赵心怡 2026年开年,国际金价一路狂飙至近56...
朗迅科技由董事长徐振控制46%... 瑞财经 刘治颖 6月24日,杭州朗迅科技股份有限公司(以下简称:朗迅科技)深主板IPO获受理,保荐机...
两部门:2030年可再生能源制... 【两部门:2030年可再生能源制氢规模达到200万吨】财联社6月25日电,国家发展改革委、国家能源局...
原创 警... 大家好,这里是全球脉冲。 6月16日,日本央行宣布加息25个基点,政策利率上调至1%,创下31年来最...
黄金钻石回收怎么选?上海市场常... 近年来黄金价格持续走高,不少上海市民都有变现家中闲置黄金首饰、投资金条的打算。但市面上回收门店数量众...
专访火山引擎谭待:模型好对Ma... 文 | 邓咏仪 编辑 | 张雨忻 火山引擎总裁谭待 来源:火山引擎 过去三年,火山引擎总裁谭待给团...
女董事长深夜被带走,牵出金融旧... *此图由AI生成 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro 大半夜的,一家上市公司董事...
盯盯拍报考港交所上市:出海翻红... 撰稿|贝多 来源|贝多商业&贝多财经 6月22日,盯盯拍(深圳)技术股份有限公司(下称“盯盯拍”)递...
苏州千亿市值上市公司+1! A股“苏州板块”又诞生了一家千亿市值企业。 昨日(6月25日),苏州上市公司永鼎股份股价在昨日涨停的...
芯片股猛拉!600667,一字... 【导读】创业板指一度涨超2%,存储芯片、半导体、电子元器件等方向涨幅居前 中国基金报记者 李智 一起...
分析师:海峡收费与否已不重要 ... 来源:格隆汇APP 格隆汇6月25日|阿曼方面重申,霍尔木兹海峡未来安排不涉及通行费。美国财经网站i...
《内外贸一体化企业评价通则》团... 齐鲁晚报·齐鲁壹点记者 管悦 6月25日,《内外贸一体化企业评价通则》团体标准审查会在济南召开。该标...
提升AI智能体工作流的速度与能... 智能体工作流是一种由AI驱动的软件系统,它通过串联多个模型与外部工具来处理复杂任务,例如分析视频并回...
热搜!又有纸尿裤被曝检出甲酰胺... 来源:市场资讯 (来源:北京商报) 网友:“囤了200多包”。 近日,多个婴幼儿纸尿裤品牌“被检出...
埃森哲内部录音曝光:企业AI使... IT之家 6 月 26 日消息,科技媒体 404Media 昨日(6 月 25 日)发布博文,披露了...
FIBA期待杨瀚森表现 最新实... 北京时间6月25日消息,FIBA国际篮联公布了最新一期世界杯预选赛亚太区球队实力榜,中国男篮排在澳大...
收评:创业板指放量反弹涨2.8... 市场冲高回落后,再度震荡拉升。黄白线分化明显,权重股走势较强。量能明显放大,沪深两市成交额3.59万...
巨头财报引爆A股存储芯片板块,... 当地时间6月24日美股盘后, 美光科技(MU.US)公布截至5月31日的2026财年第三财季财报,业...
银行、消金公司助贷余额增速不得... 近日,中国证券报记者从多位业内人士处独家获悉,5月以来,多地金融监管部门对部分中小银行、消金公司下达...