UER(腾讯)
admin
2024-04-03 05:21:32
0

现存的预训练模型中没有一种可以完美的适用于所有任务,这也给预训练模型的选择带来困难。对于这个问题,论文提供了一种切实可行的解决方案,即UER(Universal Encoder Representations)。

论文标题:UER: An Open-Source Toolkit for Pre-training Models;

论文地址: https://arxiv.org/abs/1909.05658

自然语言处理(NaturalLanguage Processing, NLP)主要研究如何让计算机读懂人类的自然语言,该技术是人工智能非常重要的研究领域之一,也是人工智能最难解决的问题之一。幸运的是,得益于迁移学习技术的发展,自然语言处理在近些年也取得了快速的发展,并广泛应用于机器翻译、信息检索等领域。

何为迁移学习?在自然语言处理的背景下,迁移学习本质上是在一个源领域(Source Domain)数据集上预训练模型,然后对该模型进行调整,以在目标领域(Target Domain)数据集上执行自然语言处理功能。在这个过程中,用于训练模型的源领域与用于任务执行的目标领域往往存在不一致性,因此预训练的模型往往无法直接完成目标领域的自然语言处理任务,那为什么还要进行模型预训练呢?

首先,源领域与目标领域之间的差异性与一致性是并存的,经过大数据训练的模型参数往往在小数据集上也是通用可行的。

其次,在源领域预训练好的模型只需要经过微调,就可以应用于目标领域上,而无需重新训练,因此可以节省训练时间与计算量。

预训练模型有很多种,比如谷歌 BERT 模型、GPT 模型、ELMo 模型等,由于下游任务的多样性及运算能力的限制,现存的预训练模型中没有一种可以完美的适用于所有任务,这也给预训练模型的选择带来困难。对于这个问题,论文提供了一种切实可行的解决方案,即 UER(Universal Encoder Representations)。

通过构建一个整合的预训练工具箱,UER 包含了多个低耦合的模块,各模块中包含现有的主流模型,用户可以很方便的调用这些模型,也可以根据任务需求个性化设计自己的预训练模型。此外,UER 提供了基于不同语料库而训练的模型群,这些模型可帮助用户在下游数据集上取得良好的语言处理结果。

1. 研究背景

NLP 模型包含很多超参数,这些参数的确定过程通常比较复杂,而不同的参数值会对模型的性能产生很大的影响。一般文章很难记录超参数的选取细节及代码,这也为什么我们在重复别人的工作时很难取得与原文作者相似的结果。为此,很多系统提供了解决方案。

北大、人大联合开源工具箱UER,3 行代码完美复现BERT、GPT! - 腾讯云开发者社区-腾讯云

GitHub - luhua-rain/MRC_Competition_Dureader: 机器阅读理解 冠军/亚军代码及中文预训练MRC模型

GitHub - dbiir/UER-py: Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo

腾讯开源UER-py - 知乎

相关内容

热门资讯

亚朵节后价格“跳水”超70% 春节过后,部分热门小城的亚朵酒店房价上演“过山车”行情,房价节前飙升,节后迅速跳水,巨大的价格波动引...
原创 金... 你绝对想不到,同样一克999足金,在深圳水贝批发市场只要1334元,走进周大福门店却变成1545元,...
德兰明海冲击港交所!递表前大手... 又一家储能企业“叩响”了港交所大门。近期,港交所官网显示,中小型用户侧储能企业深圳市德兰明海新能源股...
绿茶集团、猫眼娱乐发布正面盈利... |2026年2月25日 星期三| NO.1绿茶集团发布正面盈利预告 2月24日港股收市后,绿茶集团(...
安宁市的历史文化及名人有哪些 安宁市,这座坐落在彩云之南的城市,宛如一颗璀璨明珠,散发着迷人的历史文化魅力。在这里,岁月留下了深深...
中国央行连续12个月加量续作M... 来源:中国新闻网 中新社北京2月24日电 (陶思阅)中国央行24日发布中期借贷便利(MLF)招标公告...
不是15%?特朗普10%全球关... 据美国海关及边境保卫局(CBP)发布消息,特朗普政府将实施的新全球关税为10%。 第一财经收到的CB...
2026年春节出游人次、消费金... 2026年春节,为期9天的超长假期点燃了全国消费热情,多项核心数据创下历史纪录。 经文化和旅游部数据...
美国联邦存款保险公司(FDIC... 美国联邦存款保险公司(FDIC):美国银行业存款季环比下滑2%。
2026春节AI大战深度复盘:... 主编温静导读:2026年春节,元宝、千问、豆包三大巨头以红包、免单为杠杆,发动了一场规模空前的用户争...
期市节后首日金属板块普涨 白银... 本报记者 王宁 2月24日,春节后的首个交易日,国内期货市场呈现涨多跌少态势。 从板块表现来看,农产...
月跌超10%背后:软件行业,将... 此前一天,2月23日,人工智能公司Anthropic宣布,其Claude Code工具可用于在IBM...
公告精选 |《飞驰人生3》票房... 控制权收购 东阳光(600673.SH):公司正在筹划通过发行股份的方式收购宜昌东数一号投资有限责任...
东阳光:筹划收购东数一号控制权... 上证报中国证券网讯(记者 骆民)东阳光公告,公司正在筹划通过发行股份的方式收购宜昌东数一号投资有限责...
原创 高... 你有没有发现,几年前人人都在拼命买房,而现在,越来越多人开始思考,房子,到底还是不是财富? 这几年,...
这个春节,中国经济热力值拉满 2026年的春节,注定要在中国消费市场上留下浓墨重彩的一笔。 当9天的超长假期遇上持续加码的政策红利...
2026年中国汽车产业十大趋势... 2025年,中国汽车产业在连续17年产销量稳居全球第一的基础上,再次交出了一份充满变革与挑战的答卷。...
2022年天猫烘焙厨电行业趋势... 今天分享的是:2022年天猫烘焙厨电行业趋势白皮书 报告共计:7页 烘焙厨电迎来新变革:从“功能单一...