阿里云CTO谈大模型开闭源之争:模型应用不能只对接一个形式 阿里云参与大模型标准 阿里云训练大模型
admin
2024-05-10 08:56:57
0

界面新闻记者 | 肖芳
界面新闻编辑 | 宋佳楠

5月9日,阿里云正式发布通义千问2.5,并称在中文语境下,模型性能全面赶超GPT-4 Turbo。相比于通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%和10%。

当前行业对大模型的关注除了各项参数本身,有关开源与闭源路线之争也成为一大焦点。谈及此话题,阿里云首席技术官周靖人在接受界面新闻等媒体采访时表示,模型之上的应用和创新非常多,不能仅仅局限于使用某一款闭源的框架或者说只能对接某一个形式。

在他看来,不管在PC端还是手机端,大模型可以适配各种各样的场景,能够快速搭建更加复杂的业务,而这需要一个非常开放的开源生态去对接,全球开发者以及全球企业都在拥抱这样一个体系。

和周靖人的观点所不同,百度CEO李彦宏在今年4月的一次内部讲话中表示,闭源模型在能力上会持续地领先,而不是一时地领先。模型开源也不是一个众人拾柴火焰高的情况,这跟传统的软件开源,比如Linux、安卓等很不一样。

李彦宏认为闭源是有真正的商业模式的,是能够赚到钱的,赚了钱才能聚集算力、聚集人才。

在李彦宏表达其看法之后,多位互联网大佬给出了自己的判断。比如,360公司CEO周鸿祎表示,一直相信开源的力量,未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。知名投资人朱啸虎则称,开源小模型必然是未来方向,且商业机会很多。

大模型开源和闭源的路线之争,本质上是在探讨开发者能否帮助大模型进行迭代升级。

大模型的开源和软件开源是完全不同的逻辑,开源软件因为代码完全公开,社区开发者可以参与迭代,不断提升软件能力。但开源模型像一个“黑箱”,不管是模型、算法还是数据,都无人知晓,只是最终产生一个模型开放给用户使用。在一些坚持闭源逻辑的厂商看来,开发者参与对大模型迭代帮助不大,开源大模型和开源软件是两回事。

对此,周靖人表示,整个开源的开发者生态对技术发展的贡献毋庸置疑,这也是他对开源生态基本的判断。

他指出,大模型带来的潜力还没有被真正挖掘出来。目前有很多企业是结合自实际的开发场景和业务需求去做,未来还将有一个翻天覆地的变化。在这个时间点,阿里云希望能够以开放的心态把先进的技术开源出来,让大家做并行探索。

阿里云公布的最新数据显示,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。

通义大模型已经在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等多个领域落地,阿里云坚持的开源生态也不仅限于大语言模型领域,还包括视觉模型、声音模型。比如,中国科学院国家天文台人工智能组基于通义千问开源模型开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义大模型支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

另据界面新闻了解,虽然阿里云一直坚持开源模式,但其也在布局闭源模型。目前无论是开源模型还是闭源模型,大模型平台还未靠大模型本身实现盈利。从亚马逊等国际互联网巨头的实践也可以看出,他们是在通过出售搭载大模型能力的云服务赚钱。

有分析认为,阿里云现阶段强调坚持开源,目的不仅仅是开源本身,而是通过开源把大模型能力做强。

阿里云方面也在有意强调通义千问的能力。除了通义千问2.5在中文语境下模型性能全面赶超GPT-4 Turbo之外,通义还发布了最新款开源模型——1100亿参数的Qwen1.5-110B,据称该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。

相关内容

热门资讯

2026麻涌镇企业短视频制作:... 麻涌镇企业短视频制作是以本地制造业与服务业诉求的内容生产与平台运营服务,2026年,这一行业的竞争核...
4nm近售罄、部分8nm接近满... 《科创板日报》7月4日讯据朝鲜日报报道,业内人士称,随着AI半导体需求升温、全球大型科技公司订单增加...
新思考电机冲刺港股:4个月营收... 雷递网 雷建平 7月5日 新思考电机日前更新招股书,准备在港交所上市。 新思考电机最近一次融资是2...
端午只吃粽子就够了吗?上海歧黄... 端午一到,粽叶香、艾草香、咸鸭蛋和家常菜的味道,就把节日气氛拉满了。很多人一提到端午饮食,第一反应就...
整顿AAA评级 记者 蔡越坤 2026年6月以来,在国内某头部评级机构工作的周宇感到压力骤增。 随着6月30日、7月...
原创 必... 很多人一看到“必胜客被卖了”,第一反应就是:这牌子是不是不行了? 可现实偏偏很拧巴。 一边是美国那边...
原创 美... 无视美国制裁,采购伊朗石油,这样的“硬骨头”,放眼世界也只有一个。 为了继续施压伊朗,美国可以说是什...
布米普特拉北京投资基金管理有限... 美国私营部门就业市场在六月份释放出温和降温的信号。根据薪资服务商ADP最新发布的报告,当月企业新增就...
原创 女... 去年底一次聚餐,桌上放着几支口红、一瓶香水,还有一个印着大牌标识的小盒子。有人随手拿起来说,这是代购...
原创 蚂... “灵活用工第一股”来了! 作者|刘俊群 编辑|刘钦文 你在奶茶店、餐厅、商超、酒店里遇到的兼职店员,...
原创 还... 中国与美国这两个大国的任何一个细微动作,似乎都会牵动全球金融市场的神经,引发一连串连锁反应。本就还剩...
从“固定区间”到“动态指数”,... 银行理财产品业绩基准展示方式正迎来新变化。7月5日,北京商报记者梳理发现,包括中邮理财、民生理财、华...
兰格钢铁杭州建材周报(七月第一... 来源:兰格钢铁网 兰格钢铁杭州建材周报(七月第一周) 本周(6.29-7.3)杭州建筑钢材市场现货...
全球存储巨头,拟涨价20% 来源:上海证券报 7月3日,据韩媒ZDNET Korea报道,三星电子正在与客户展开第三季度通用DR...
近视、远视、斜视、弱视,同样是... 听说孩子看不清黑板,很多家长第一反应就是“近视了”,于是直接带去眼镜店配副眼镜应付。但很多朋友不知道...
2026年苏州电商建站开发可靠... 在数字经济持续渗透的今天,一个功能强大、体验流畅、安全稳定的电商网站,已成为企业开拓线上市场、构建品...
券商周线4连阳,这次是真反转?... 来源:新浪基金 7月3日,券商板块窄幅震荡,规模400亿元的顶流券商ETF华宝(512000)场内价...
央行将加量续做3个月期买断式逆... 本报记者 刘琪 7月3日,中国人民银行发布公告称,为保持银行体系流动性充裕,2026年7月6日,将以...
原创 《... 猪有什么错? 作者 | 方璐 编辑丨于婞 来源 | 野马财经 一篇牧原股份(002714.SZ)14...
中国空调在欧洲卖爆了:边筑墙边... 近期,高温席卷欧洲多国,受限于环保政策、高电价、对古老建筑保护、高温天气少等种种考虑,使得在欧洲安装...