每日学术速递3.20
创始人
2025-05-31 04:00:37
0

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CL

1.ART: Automatic multi-step reasoning and tool-use for large language models

标题:ART:大型语言模型的自动多步推理和工具使用

作者:Bhargavi Paranjape, Scott Lundberg, Sameer Singh, Hannaneh Hajishirzi, Luke Zettlemoyer, Marco Tulio Ribeiro

文章链接:https://arxiv.org/abs/2303.09014

摘要:

        大型语言模型 (LLM) 可以通过生成中间思维链 (CoT) 推理步骤在少镜头和零镜头设置中执行复杂推理。此外,每个推理步骤都可以依赖外部工具来支持超出核心 LLM 功能(例如搜索/运行代码)的计算。之前关于 CoT 提示和工具使用的工作通常需要手工制作特定于任务的演示,并仔细编写模型生成与工具使用的交错脚本。我们介绍了自动推理和工具使用 (ART),这是一个使用冻结的 LLM 自动生成中间推理步骤作为程序的框架。给定一个要解决的新任务,ART 从任务库中选择多步推理和工具使用的演示。在测试时,只要调用外部工具,ART 就会无缝地暂停生成,并在恢复生成之前整合它们的输出。ART 在 BigBench 和 MMLU 基准测试中对未见任务的小样本提示和自动 CoT 进行了实质性改进,并且在大多数这些任务上与手工制作的 CoT 提示的性能相匹配。ART 也是可扩展的,并且使人类可以轻松地通过纠正特定任务程序中的错误或合并新工具来提高性能,我们通过在最少的人工干预下显着提高选定任务的性能来证明这一点。

Subjects: cs.LG

2.SemDeDup: Data-efficient learning at web-scale through semantic deduplication

标题:SemDeDup:通过语义重复数据删除进行网络规模的数据高效学习

作者:Amro Abbas, Kushal Tirumala, Dániel Simig, Surya Ganguli, Ari S. Morcos

文章链接:https://arxiv.org/abs/2303.09540

摘要:

        机器学习的进步在很大程度上是由数据的大量增加推动的。然而,像 LAION 这样的大型网络规模的数据集除了搜索精确的重复项外,基本上没有经过整理,可能会留下很多冗余。在这里,我们介绍 SemDeDup,这是一种利用预训练模型的嵌入来识别和删除语义重复项的方法:语义相似但不完全相同的数据对。删除语义重复项可以保持性能并加快学习速度。通过分析 LAION 的一个子集,我们表明 SemDeDup 可以删除 50% 的数据,而性能损失最小,从而有效地将训练时间减半。此外,性能会因分布而增加。此外,通过分析在 C4(部分精选的数据集)上训练的语言模型,我们表明 SemDeDup 比之前的方法有所改进,同时提供了效率提升。SemDeDup 提供了一个示例,说明如何使用利用质量嵌入的简单方法来使模型用更少的数据更快地学习。

Subjects: cs.CV

3.Efficient Diffusion Training via Min-SNR Weighting Strategy

标题:通过 Min-SNR 加权策略进行有效的扩散训练

作者:Tiankai Hang, Shuyang Gu, Chen Li, Jianmin Bao, Dong Chen, Han Hu, Xin Geng, Baining Guo

文章链接:https://arxiv.org/abs/2302.01660v2

项目代码:https://github.com/ysig/learnable-typewriter

摘要:

        去噪扩散模型一直是图像生成的主流方法,但是,训练这些模型通常会收敛缓慢。在本文中,我们发现缓慢收敛的部分原因是时间步之间的优化方向相互冲突。为了解决这个问题,我们将扩散训练视为一个多任务学习问题,并引入了一种简单而有效的方法,称为 Min-SNR- γ 。该方法根据钳位信噪比调整时间步长的损失权重,有效地平衡了时间步长之间的冲突。我们的结果表明收敛速度有了显着提高,比以前的加权策略快 3.4 倍 。它也更有效,使用比以前最先进的架构更小的架构在 ImageNet 256×256 基准测试中取得了 2.06 的新纪录 FID 分数。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

相关内容

热门资讯

三亚凤凰国际机场附近停车场突发... 1月30日中午,网传三亚凤凰国际机场附近一停车场发生大火,不少车辆被烧,并产生大量浓烟,14时许,三...
胖东来好做法,上升为省级标准! 政府工作报告提出,推广胖东来经验,打造一批带动面广、显示度高的消费新场景。这一提法正在通过一系列河南...
BLUEBERRY:四季度黄金... 从需求结构来看,四季度黄金需求再创新高,为全年走势画上了一个具有象征意义的句号。 这一现象表明,在不...
石药集团185亿美元出海背后:... 中国创新药再现百亿美元巨额BD(商务拓展)交易。 1月30日,石药集团(01093.HK)公告称,与...
华熙生物董事长商业版图盘点 近日,华熙集团董事长、华熙生物董事长兼总裁赵燕“让人能够健康,能蹦能跳,能吃能睡的活到超过120岁”...
从资本集聚到IPO爆发!千灯湖... 1月29日,由千灯湖创投特色小镇入驻机构——浙江振石新材料股份有限公司正式在上交所主板挂牌上市。 事...
马斯克被曝推进太空算力 利用太... 快科技1月30日消息,据媒体报道,美国企业家埃隆·马斯克正探索整合旗下核心资产(包括SpaceX、特...
90后戴龙升任总经理,身兼多职... 1月30日早上,新诺威(SZ300765,市值546亿元)迎来新任总经理和新任董事会秘书,二人皆为“...
黄金、白银历史价格和库存数据(... 黄金、白银历史价格和库存数据(2026年更新) 黄金、白银历史价格和库存数据(2026年更新) 黄金...
任和、张仲麟:低空经济要成型,... “低空经济”如火如荼,许多城市都在加速“向天空要增量”:无人机物流、电力巡检、农业植保、应急救援等应...
北交所上市公司*ST云创登龙虎... 每经讯,2026年1月30日,北交所上市公司*ST云创(920305,收盘价:7.1元)登上龙虎榜,...
中国通信服务荣膺「金紫荆奖」「... 1 月 30 日,由香港大公文汇传媒集团联合香港中国企业协会、香港中国金融协会、香港中资证券业协会、...
马斯克被曝筹划推进太空算力 新华社北京1月30日电 据多家媒体29日报道,美国企业家埃隆·马斯克正考虑整合旗下资产,从而推进太空...
中国银河给予银行行业推荐评级:... 每经AI快讯,中国银河1月30日发布研报,给予银行行业推荐评级。 市场风格切换,主动型资金延续欠配状...
国电南瑞:公司持续深耕虚拟电厂... 证券日报网讯 1月29日,国电南瑞在互动平台回答投资者提问时表示,近年来,国家大力推动电力现货市场建...
美元持续下跌 “抛售美国”现象... 美国财政部长斯科特·贝森特对“强势美元政策”的确认未能逆转美元跌势。美元反弹戛然而止,1月29日再度...
暴跌!刚上车就亏没了!黄金还能... “上周才买了黄金,这周直接跳水!” “不是说避险资产吗?怎么跌得比股票还狠?” 国际金价连续下跌...
东海航运保险迎来新任董事长吴冰... 近期,东海航运保险股份有限公司(以下简称“东海航运保险”)发布公告称,董事会选举吴冰灿任第二届董事会...
美元大涨、黄金暴跌!特朗普挑了... 财联社1月30日讯(编辑 潇湘)随着有消息人士透露特朗普政府正准备提名凯文·沃什担任下一任美联储主席...