只要会说话,不写代码也能开发!百度又搞了一个大动作 只要会说话就能写程序 只要会说话
admin
2024-04-17 16:59:41
0


新智元报道

编辑:编辑部

【新智元导读】文心大模型4.0,半年时间又提升了52.5%,在智能体、代码、多模型上也有了新进展!像人一样思考的智能体,达到了一定程度的白盒;智能代码助手Comate,让开发者们动动嘴就能开发应用了。

文心大模型,又有新进展了!

就在昨天,Create 2024百度AI开发者大会成功举办,又公布了一波智能体、代码、多模型等方面的新进展。

去年3月16日,文心一言发布,此后不断迭代。

基于更大的算力、更多的数据和更强的算法,依托飞桨平台,文心已经从3.0、3.5,进化到了4.0版本。


AI智能体,像人一样思考

毫无疑问,智能体是业内一致被看好的方向。

对此,百度CTO王海峰也表示,智能体会带来更多的应用爆发。

而如今的百度智能体,已经学会像人一样思考了!

在基础模型上,它进一步进行了思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。

于是,它学会了像人一样阅读说明书、学习工具试用,甚至还能调用工具完成任务。


为了详细说明这个过程,我们可以参考一下《思考,快与慢》这本书中的理论。

人的认知系统,可以划分为2个部分:系统1反应很快,但容易出错。系统2反应慢,但更理性,更准确。


在强大的基础大模型之上,百度的研发团队进一步研制了系统2,包括理解、规划、反思和进化。

这样,智能体的思考过程在一定程度上就白盒化了,于是机器可以像人一样思考和行动,自主完成复杂任务,持续学习,实现自主进化。


让我们来具体感受一下,百度智能体的思考过程。

在文心大模型4.0工具版上,我们可以这样提问——

「我要到大湾区出差一周。想了解一下天气变化,好决定带什么衣服。请帮我查一下未来一周北京和深圳的温度,告诉我出差应该带什么衣服,并整理成表格。」

接下来,它就会展示真正的技术了。

首先,它会调用一个「高级联网」工具,来查询当地的天气信息。


然后,它会调用「代码解释器」,来画出一幅温度趋势图。


根据未来一周的天气,它选择了合适的衣物。


最后,它还对结果进行了思考和确认,自动汇总成了一个表格。


整个过程中,它展现出了娴熟的思考和规划能力,有条不紊地把用户需求拆解成多个子任务,一整套过程行云流水。

不仅如此,从万亿级的训练数据中,文心大模型学到的,除了自然语言能力外,还有代码能力。

代码智能体

顾名思义,这个智能体,能够帮我们写代码。

程序员和普通人的之间的壁垒,从此彻底打破,以前程序员才能做的事,现在人人都能做。

代码智能体,是由思考模型和代码解释器两个部分组成。

首先,思考模型会先理解我们的需求,经过一番思考后,把完成任务的指令和相关信息整合成提示,输入给代码解释器。

根据这个提示,代码解释器就把自然语言的用户需求翻译成了代码,随后执行,这样就得到了执行结果,或调试信息。


最后,思考模型还会对代码解释器的结果进行反思确认。

结果正确,就会把结果返回给用户;不正确,就会继续进行自主迭代更新。


在这次大会现场,王海峰更是当场让代码智能体秀了一番技能。

现场的任务是,让它为本次大会嘉宾定制邀请函。


只见一波操作之后,嘉宾的姓名都被填到了邀请函里正确的位置上。

而新生成的邀请函文件,也都是以嘉宾的名字命名的,并打包好一起输出。


动嘴开发,智能代码助手已来

而这位传说中的智能代码助手Comate,听名字就知道它更专业一些。


没错,它的角色是——程序员的AI同侪,也就是说,可以帮专业的程序员更高效地写出更好的代码。

过去,开发者用代码改变了世界。

而现在,自然语言已经成为新的开发语言。也就是说,开发者们未来只需动动嘴,就能完成应用开发。


在模型效果不断提升的基础上,百度进一步构建了上下文增强、私域知识增强、流程无缝集成等能力。

因此,目前百度智能代码助手Comate整体采纳率达到了46%,新增代码中生成的比例已经达到了27%。


代码理解、生成、优化等各种能力,都被Comate无缝集成到研发的各个环节。

比如,仅需告诉Comate「帮我梳理当前项目的架构」,几秒的时间,它就以清晰的条理给出了解答。


它就像助理一样,能帮助程序员提升代码的开发质量和效率。

下面这个示例,就展示Comate是如何帮工程师接手代码的。

可以看到,只通过一条简单的指令,它就快速了解了整个代码的架构,甚至细到每一个模块的具体实现逻辑。

举个例子,当你问到更加细致,具体的内容时——「该项目核心RAG逻辑是如何实现的」,可以迅速得到解答。

更惊喜的是,还有直接跳转查阅的索引链接。


而且,它还可以根据当前的项目代码以及第三方代码,自动生成满足要求的新代码。

如下所示,给出一个外部的参考代码,以及千帆大模型的API,以生成调用Ernie Bot 4.0的代码。

Comate分分钟给出了一个基础代码示例。


大小模型一同训

此外,王海峰在现场还分享了「多模型」技术。

如今,我们为什么需要多模型?

在推进大模型应用落地的过程中,开发者、企业不仅需要关注成本,还需要顾及效果和效率。

因此,在实际应用中,就需要从落地场景出发,去选择最适合自己的模型。


一方面,高效低成本的模型生产亟待解决。

对此,百度研制了大小模型协同的训练机制,可以有效进行知识继承,高效生产高质量小模型。

小模型不仅推理成本低,响应速度快。而且在一些特定场景中,经过微调后的小模型,效果可以媲美大模型。


它也可以利用小模型实现对比增强,帮助大模型完成训练。

与此同时,百度还建设了种子模型矩阵,数据提质与增强机制,以及一系列配套工具链,从预训练、精调对齐、模型压缩到推理部署。

这样一来,高效低成本的模型生产机制,可以加速应用,降低部署成本,取得更优的效果。

我们最常见的MoE便是「多模型」技术的典型代表。


可以看到,不论是GPT-4(据猜测),还是开源Grok、Mistral都采用了MoE架构。

它们都在基准测试中,取得了优异的表现。

百度认为,未来大型的AI原生应用基本都是MoE架构。通过大小模型的混用,而非单一模型去解决问题。

因此,针对场景匹配,什么时候调用大模型,什么时候调用小模型,都需要技术考量。

另一方面,是多模型推理。

百度研制了基于反馈学习的端到端多模型推理技术,构建了智能路由模型,进行端到端反馈学习,充分发挥不同模型处理不同任务的能力,达到效果、效率和成本的最佳平衡。


正如Robin会上所言,通过强大的文心4.0裁剪出更小尺寸的模型,要比直接拿开源模型,微调出来的效果要好得多。

这段时间,一张开源模型与闭源模型之间的差距不断拉近的图,在全网疯转。

许多人乐观地认为,开源模型很快突破极限,取得逼近GPT-4,甚至替代闭源模型的能力。


实则不然,开源模型并非拿来即用,而需要更多定制化的微调。

这也是百度发布了ERNIE Speed、Lite、Tiny三个轻量模型的原因。

通过文心大模型4.0,压缩蒸馏出一个基础模型,然后再用专门数据训练。这要比基于开源模型,甚至重训一个模型效果好得多。

文心4.0性能提升52.5%

除了上述这些之外,文心4.0的创新还包括基于模型反馈闭环的数据体系、基于自反馈增强的大模型对齐技术,以及多模态技术等等。


发布后的半年时间,文心4.0的性能又提升了52.5%。


文心大模型之所以能如此快速持续地进化,离不开百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%。

相比而言,一年前文心一言发布时,训练效率直接提升到了当时的5.1倍,推理则达到了105倍。


截至目前,飞桨文心生态已经凝聚了1295万开发者,服务了24.4万家企事业单位。基于飞桨和文心,已经有89.5万个模型被创建出来。


如今,文心一言累计的用户规模已达2亿,日均调用量也达到了2亿。

这2亿用户的工作、生活和学习,已经被文心一言改变。

500万AI人才培养计划,提前收官

最后值得一提的是,百度的500万AI人才培养计划,提前收官!

在2020年,百度曾提出5年内要为全社会培养500万AI人才,如今目标已经提前完成。


而王海峰表示,在未来,百度还会继续投身人才培养,让人才的点点星光,汇成璀璨星河。

智能时代,人人都是开发者,人人都是创造者。

参考资料:

https://create.baidu.com/?lng=zh



相关内容

热门资讯

4家银行AIC现身存储巨头股东... 近日,资本市场热度颇高的两家存储巨头长鑫科技集团股份有限公司(以下简称“长鑫科技”)、长江存储控股股...
8元无限续杯、0元看电影、老字... 城市的烟火暖意,藏在亲民的消费场景里,也藏在老地标的新生蜕变中。粤汉码头火车旁新开竹林茶馆,8元就能...
2026年水利工程新趋势,这些... 随着全球气候变化和城市化进程的加速,水利工程在保障水资源供给、改善生态环境以及提升人民生活质量中的作...
原创 发... 这几年,身边越来越多人开始换一种活法:不急着买房,不执着“上车”,反而愿意把钱拿去租一套更舒服、更体...
小红书入场Skill分发,B站... 来源:界面新闻 文丨AI价值官 星野 编辑丨美圻 过去半年,Skill 这个词在AI圈的出现...
2026年福州企业门户网站建设... 本篇将回答的核心问题 在数字化转型加速的2026年,企业门户网站建设应遵循哪些核心评估标准,以确保投...
原创 今... 今日金价:2026年5月22日注意了!黄金或现历史类似回调走势 5月22日,金市又热闹起来了,咱们看...
雷军发布YU7 GT、YU7标... 5月21日,小米人车家全生态新品发布会在北京举办,小米集团创始人、董事长兼CEO雷军正式发布小米YU...
留神峪煤矿瓦斯爆炸事故发布会:... 昨晚,山西留神峪煤矿发生瓦斯爆炸,造成重大人员伤亡。今天,当地召开新闻发布会,现场全体默哀。会上介绍...
原创 修... 修复资产负债表,日本花了几十年。 自上世纪90年代初泡沫经济破裂后,日本陷入了长达三十年的通缩螺...
2026年小红书效果化种草白皮... 2026 年小红书正式迈入种草效果化时代,这是品牌追求预算确定性回报与平台升级为消费决策、用户信任场...
连续18年获“全国文化企业30... 南都讯 记者钟欣5月21日,第二十二届中国(深圳)国际文化产业博览交易会开幕。展会期间,光明日报社和...
荣耀确认IPO未终止!开放员工... 5月22日,荣耀因股改满一年未完成IPO,按约定正式开放员工持股退出通道。据《财闻》报道称,当日16...
易方达蓝筹精选有新变动:增聘2... 《每日经济新闻》记者获悉,继景顺长城、中欧等多家基金公司旗下百亿基金经理产品调整后,易方达基金也迎来...
光储龙头,又翻倍了 去年海外光储赛道最受关注的公司,毫无疑问是阳光电源,市值重回巅峰,风光无限。 但今年一季度业绩突然失...
中企出海报告在静安发布,七成受... 来源:滚动播报 (来源:上观新闻) 昨天,在上海静安举办的澳洲会计师公会出海论坛暨澳洲注册会计师颁...
京蒙协作延链强链 科右中旗牛产... 初夏时节,走进内蒙古华阳牛业科技集团有限公司屠宰加工车间,自动化生产线高效运转。作为京蒙协作产业帮扶...
原创 中... 最近发布了一份有关新一线城市魅力的榜单。榜单按照商业资源聚集度、城市枢纽性、城市人活跃度这五个方面来...
突然,全线跳水!超16万人爆仓 来源:宁波晚报 5月23日,被视作反映市场风险偏好指标的加密货币持续跳水。 截至发稿,比特币大跌3....
基民懵了!说好的科技行情,结果... 每经记者:叶峰 每经编辑:赵云 本周股指冲高回落,沪深两市股票型ETF和跨境型ETF合计净流出729...