商汤发布“日日新5.0”全面超越GPT-4,小米SU7团队都来登门道谢,股价暴涨30% 商汤科技日日新 商汤日日新大模型发布会完整
admin
2024-04-24 21:39:00
0

文 | 李然

编辑 | 苏建勋

大模型时代依然活跃在舞台中央的“AI 1.0时代四小龙”之一的商汤科技,在昨天召开的技术交流会上,官宣了他们“云端边”的全栈产品矩阵。

在参加完发布会,和产品以及技术线的负责人聊了几个小时,试用了每一款发布会的产品,参观了商汤的算力中心之后,36氪最强烈的感受是:

在AI领域深耕了10年的商汤,终于在大模型这棵树上结出了行业中最丰硕的成果。它集合了大厂的深度和广度,创业公司的速度,成为了全国,甚至全世界范围内都独一无二的“AI综合体”公司。

一句话概括商汤新发布的内容:模型能力上打GPT-4,落地应用下接千行百业。

商汤发布的产品线,几乎覆盖了国内外主流AI大厂和头部公司的核心业务:

对标OpenAI,Anthropic以及谷歌的基座大模型日日新大模型5.0


来源:商汤

Midjourney和Stability AI这样公司的开源/闭源的文生图模型和社区;


来源:商汤

国内其他AI大厂和巨型独角兽相似的基于基座模型的行业应用落地能力。


来源:商汤

小米SU7团队专门来发布会上感谢商汤提供的支持

而在初创公司瞄准的赛道上,商汤也卷出了自己的一片天:

端侧模型让手机一秒就生图;


来源:官方

代码/办公小浣熊等实用功能继续更新,造福几十万辛苦打工人;


来源:官方

推出AI边缘硬件,让需要低成本本地化AI解决方案的组织,也能享受定制化AI带来的效率提升。


来源:官方

纵观商汤在发布会上亮相的这一系列产品和服务,它的业务可以理解为两条线,一条线是遵照“Scaling Law”,不断扩充基础模型的能力;另一条线是以强大的基础模型能力为根基,将模型能力尽可能的落地到任何能够提升效率,体现价值的场景。

商汤用业内几乎最长的产品线,把自己的客户横跨的行业范围从西二旗拉到了金融街;同时也让竞争对手名单,从硅谷的科技大厂排到了孵化器里的初创公司。

而就在发布会之后,商汤的股价也应声大涨,今日开盘即上涨超30%,最高冲至0.82港元。截至上午10时40分,商汤股价为0.8港元,成交额超10亿港元,涨幅31.15%。


来源:公开资料

以“Scaling Law”为尺,日日新5.0能力全面对标GPT-4-Turbo

发布会一开始,商汤没有着急给大家介绍自家的产品,反而是先科普了一条AI行业的基本原理——“Scaling Law”。


来源:官方

它之所以这么做,在36氪看来,商汤是想用“Scaling Law”说明,大模型的能力是可以不断提升并且预测的,。

在这个逻辑之下,GPT-4被祛魅。

而它所代表的行业天花板就不再是不可触碰的——只要不断提升模型参数,优化数据集,积累算力,模型能力就能稳步提升。

达到甚至超越GPT-4就不再是遥不可及的目标以及自欺欺人的自嗨,而是一个客观的现实。

而最新版的日日新SenseChat 5.0也在商汤不断努力之下,确实做到了各方面能力都可以对标GPT-4。


来源:官方

除了性能之外,他的主要亮点还体现在下面几个方面:

第一,采用混合专家架构(MoE),能够完成6000亿的参数,并且激活少量参数就能完成推理,保持推理效率。第二,基于超过10TB tokens的训练数据,并具有几千亿的合成数据。第三,推理上下文窗口达到200K 。第四,增强知识、推理、数学、代码能力,全面对标 GPT-4 Turbo。

在模型输出与GPT-4-Turbo的横评对比中,我们印象最深的一个例子是:

有13个小朋友玩老鹰抓小鸡,1人扮演老鹰,12个扮演小鸡,已经抓了5只小鸡,还剩几只?

GPT-4给出答案是抓了5只当然还剩8只,商汤模型给的答案还减掉1只老鹰,所以还有7只没有被抓住。


来源:官方

可以看出商汤的日日新大模型5.0在对中文语料的理解上,确实是比GPT-4更接近于现实世界的情况。

超越GPT-4V的多模态能力

根据商汤技术测负责人透露,商汤日日新大模型的多模态能力是和谷歌Gemini类似,采用了原生的多模态技术,而业界包括很多GPT-4V在内,很多模型的多模态能力还是基于在语言模型上嫁接其他模态的能力而达到的。

因为采用了一个更加高级多模态实现方式,所以“日日新5.0”的图文感知能力达到全球领先水平。

在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU取得领先成绩。


来源:官方

而在图像生成方面,商汤模型的效果和行业内其他3个最常用模型比起来也非常惊艳。


来源:官方

由于跟新了业内最新的技术,商汤生图模型“秒画”的文字表现能力明显强于其他3家。

而已经造福了几十万打工人的小浣熊工具,也获得了强力更新,能够在用户使用过程中不断自己迭代和学习,产生符合用户需求的输出。

发布会上,商汤演示了将F1赛车手周冠宇三年的参赛记录输入到系统中,并让它绘制出参与比赛数量的柱状图。


来源:官方

任务看似简单,但实际上牵涉到复杂的识别难题。办公小浣熊在和用户的交互过程中,不断克服识别障碍,最终成功获取到了用户的需求数据,按照用户要求进行了输出。

率先完成“云端边”全栈布局

前瞻洞察中心化算力需求向端侧扩展的未来趋势及企业级在边缘侧的AI需求,商汤在业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

端侧大模型实现行业SOTA

今年是端侧大模型应用的元年,为了满足移动终端用户对大模型技术的应用需求,商汤推出日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。


来源:官方

商汤还推出端云协同解决方案,可通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而显著降低推理成本。

商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。


来源:官方

扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端app快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。


来源:官方

边侧推出大模型一体机,本地部署,降低大模型应用门槛

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤推出了企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。


来源:官方

相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。


来源:官方

丰富的行业落地案例是商汤大模型综合能力的最强背书

发布会现场,商汤还邀请到金山办公、海通证券、小米、阅文集团、华为等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

自2023年起,商汤与金山办公达成深度合作,基于“日日新”大模型的代码生成及工具调用能力,助力WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。


来源:官方

金山办公CEO章庆元表示:“在办公应用场景内,商汤大模型的表现十分出色,能够帮助我们的用户解决办公中的复杂问题,提升效率。”

金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。

海通证券副总经理兼首席信息官毛宇星谈到:“通过与商汤合作,我们利用大模型技术实现了海通证券数智化转型,未来,我们将结合全栈式AI能力进行业务流程、交互变革与数智化业务系统重构。”


来源:官方

在个人出行场景,小米汽车SU7的智能车舱中就应用了商汤的大模型技术,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。


来源:官方

小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”

此外,商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码等大模型产业生态。商汤的所有行业大模型都是在华为昇腾原生生态上训练完成。


来源:官方

有了华为的支持,商汤就真的有底气,向各行各业提供软硬件一体的AI解决方案。

而这次发布会,商汤向世人展现了它在AI 2.0时代的野心——成为大模型时代集合硬件,行业服务,C端产品的“全栈供应商”。

商汤不仅要通过不断的技术迭代追逐AGI,还要在通向AGI的道路上让AI赋能每个行业,每个普通人。

相关内容

热门资讯

加快完善中央银行制度!国常会讨... 5月21日,国务院总理李强主持召开国务院常务会议,研究推进全国统一大市场建设有关工作,审议通过《现代...
毕业人数历史新高,大城市却还在... 今年的毕业生人数要破纪录了,预计1270万人,和去年相比又增长了48万,再创历史新高。 按理来说,就...
28.5万亿美元——这是Spa... 全球太空探索领军者SpaceX最新发布的这份万众瞩目IPO招股说明书显示,其自行评估的SpaceX总...
乐聚智能冲击IPO,聚焦人形机... 2025年以来全球人形机器人行业进入爆发期,无论是企业数量,还是融资规模均实现跨越式增长。 据人形机...
年轻人把澡堂子玩成了社交顶配 ... 花上几百元,甚至上千元,到澡堂子待一天——这是时下最流行的休闲消费方式。当然,澡堂子们也把名字升级为...
原创 五... 无营生可做,无房产置办,也无心做任何投资,整日里就单纯陪着父亲左右度日。 这话是他说的,5月13日,...
合肥居家闲置黄金整理指南 轻松... 随着近年来黄金市场行情持续向好,合肥不少市民开始整理家中闲置的黄金首饰、金条等物品,希望通过合理处置...
廿载荣耀见证!52位券商领军者... 权威集结,见证行业标杆! 由证券时报主办的“2026中国证券业君鼎奖”活动即将进入专家评审阶段。本届...
小米YU7首战Model Y八... 快科技5月21日消息,今晚小米人车家全生态新品发布会上,雷军宣布正式推出小米YU7标准版,售价23....
小米跑车级SUV YU7 GT... 记者|李星 编辑|陈柯名 裴健如 杜恒峰 校对|程鹏 5月21日晚间,小米YU7 GT正式上市,售价...
霍尔木兹海峡封锁 日本原油进口... 据日本共同社5月21日报道,日本财务省21日公布4月贸易统计初值(通关口径)显示,从中东进口原油38...
鲍威尔任内最后一次会议纪要公布... 当地时间5月20日,美国联邦储备委员会公布的4月货币政策会议纪要表明,如果美国通胀持续高于目标水平,...
晚间开售,非标提价,茅台改革进... 出品|中访网 审核|李晓燕 5月18日,贵州茅台接连抛出两大市场动作,瞬间搅动白酒行业神经。继5月1...
海关律师、走私辩护律师邵丹:罗... 近日,罗湖海关查获旅客走私红酒3支。 某日,罗湖海关关员在对进境旅客进行监管时,发现一名男性旅客进...
原创 三... 目前全球所有的电子产品中,涨的最猛的,就是内存。 最近一年以来,平均涨了四五倍,内存厂商们是大赚特赚...
长鑫科技科创板IPO将于5月2... 观点网讯:5月20日,据上交所网站披露,上交所上市审核委员会定于5月27日召开2026年第27次上市...
345.68亿!上海S基金交易... 来源:看看新闻KNEWS 日前,由上海股权托管交易中心、上海科创中心股权投资基金管理有限公司联合主办...
腾讯云·云上好CP携手六大消费... 当告白季的温柔氛围, 撞上科技赋能的好物狂欢, 腾讯云「云上好 CP」带着六大消费电子企业CP惊喜登...
擎天租与京东集团达成战略合作,... 来源:猎云网 5月21日,擎天租宣布与京东集团达成全面战略合作,双方将围绕产品解决方案共建、渠道供应...
金鹰基金固收老将林暐一次性卸任... 5月19日,金鹰基金管理有限公司(下称“金鹰基金”)发布多份基金经理变更公告,旗下基金经理林暐因个人...