Claude炸场,最焦虑可能不是OpenAI claude最新数据 claude穿甲
admin
2024-03-06 18:06:26
0

「游戏开始(game on)。」

这是Runway联合创始人写在OpenAI发布Sora后的一句感言,某种程度上,这句话也可以送给此刻的OpenAI和Sam Altman。

随着被称为「OpenAI最强竞争对手之一」的Anthropic发布新一代的人工智能模型系列Claude 3(包括了Opus、Sonnet、Haiku三款产品),一时间中文互联网甚至出现了「全球AI大模型一夜易主」的评论。


图源:X

Claude 3之所以引发如此多的评论,原因有两方面:一是代表模型性能的各类评测指标来看,Claude Opus的得分全都超过GPT-4。二是,从用户直接体验来看,缓解了过去大模型使用过程中出现的问题,比如降低拒绝率、克服大模型的幻觉等问题。

英伟达高级科学家Jim Fan就对Claude 3给出了两个客观的评价:一是在特定领域的专家基准测试。除了相对饱和的MMLU、HumanEval等基准外,Claude还选择了金融、医学和哲学等专家领域,报告了性能表现。二就是解决了过往大模型过于「谨慎」的问题。

以Meta的开源大模型Llama 2为例,此前有人就发现,即便询问一些无害问题,比如「如何制作辣椒蛋黄酱」,但Llama 2会疯狂地表示它无法做到,因此用户需要交互多次,才能给出答案。Anthropic意识到了这一问题,降低了模型在无害问题上的拒绝率。

需要指出的是,和OpenAI一样,由于都是闭源,Claude 3的技术报告并不涉及具体的模型结构、训练方法等,因此对人们来说,这依旧是一条模糊的道路。

而从Claude炸场,对抗OpenAI,所反映出的是2024年海外大模型行业所涌现出的新趋势。

Sora拉开序幕,巨头密集上新

年初,从OpenAI携Sora开启所谓的「文生视频GPT时刻」开始,海外大模型企业就已进入了密集的模型上新期。

与OpenAI同日更新的谷歌拿出了多模态大模型Gemini 1.5,既瞄准了Claude擅长的「长文本」——Gemini 1.5能稳定处理的信息量高达100万个tokens,作为对比GPT-4 Turbo的上下文窗口大约为12.8万tokens,刚发布的Claude 3大约为20万tokens。在更新闭源大模型的同时,谷歌还推出了「开源」大模型 Gemma,主打一个「开源、闭源」两手抓。

而本就走「开源路线」的Meta也在近期被曝出推出新模型的消息。据The Information报道,Meta计划在7月份推出新的AI大模型Llama 3,参数量最高或超过1400亿,Meta希望借此可以追上OpenAI的GPT-4。一位知情人士表示,Meta还在计划任命一名内部人员对Llama 3在安全和可控性进行培训,以让其的反应更加细致。此前,扎克伯格也向投资者提到:“今年的重点领域就包括推出 Llama 3”。

科技巨头们已将模型发布提上日程,追赶GPT-4已经成为了今年的首要KPI,另一边的独角兽们在融资寒冬中也没闲着。

比如,法国AI独角兽Mistral AI就在上个月底推出了仅次于GPT-4性能的 Mistral Large和类ChatGPT产品竞争对手Le Chat。同时,还宣布和OpenAI 的「盟友」微软达成了合作。

从目前的时间线来看,这场模型「上新战」只是开始。而这对创业者来说,似乎是一个好消息。如Abacu.AI的联合创始人兼CEOBindu Reddy所说:“OpenAI不再是唯一的人工智能之王,这对每个人来说都是一个巨大的安慰。”


图源:X

最焦虑可能不是OpenAI,而是谷歌

而从Claude所引发的连锁反应来看,如今既面对强大竞争对手,又深陷与马斯克的诉讼中的OpenAI无疑是最焦虑的一个。

但事实上,从目前来看,OpenAI可能并不焦虑。首先,两家公司不同的定位被人们忽视了。据福布斯对Anthropic联合创始人的采访,这家公司反复强调:“Anthropic更像是一家企业公司,而不是一家消费者公司。”尽管从产品形态和商业模式来看,chatGPT和Claude并无明显差别,但显然Anthropic面向的是to B用户,而非C端的大众。而从Claude提供的客户案例中,这些B端客户包括了如科技公司Gitlab、Notion、Salesforce、SAP等。

其次,从战略层来看,尽管都是为了通往AGI,但OpenAI谋求「大而全」,Anthropic则偏向「小而美」。OpenAI一系列的硬件公司和算力布局,都可以印证这一点。

相比之下,更焦虑的可能是谷歌。尽管身为Anthropic背后的金主之一,但相比亚马逊对Anthropic的「热情」,谷歌却无多少反应。

谷歌在近期正在陷入一系列的争议中。一方面,Gemini陷入「种族偏见」的舆论浪潮,许多网友发现,Gemini的文生图功能出现问题,比如似乎刻意在拒绝生成白人的形象,谷歌随后下架Gemini文生图功能,谷歌CEO Sundar Pichai回应称该问题「不可接受」,并在内部信中表示,公司在修复Gemini护栏方面已经取得了进展。


据BusinessInsider的报道,一位谷歌现任高级员工将这一事件形容为「一场公关噩梦」,“谷歌员工很生气。”华尔街的分析师甚至认为,谷歌需要剔除那些胡作作非为的人,包括CEO Sundar Pichai。Bernstein分析师Mark Shmulik在一份研究报告中也思考了类似的问题——是否是时候对谷歌的高层进行改组。

尽管谷歌一直将自己形容为一家人工智能领先的公司,它的基础研究也深刻影响着此轮大模型浪潮。但无论在模型的推出节奏,还是商业化路线上,谷歌都明显迟滞于微软和OpenAI。

AI技术的迭代飞速,这意味着洗牌也在快速进行。一个有趣的观察是,如今在此轮浪潮中,被赞美的对象换成了Meta和微软。而此刻的OpenAI和谷歌,他们以技术见长,但都面临着增长所带来的代价——无论是组织内部的动荡,抑或是保守的战略。

参考资料:

1、机器之心:Llama 2第二波划重点:过于「谨慎」、代码生成改进空间大

2、BusinessInsider:How Google lost its way

相关内容

热门资讯

原创 人... 2023年,联合国人口司报告:印度人口超过了中国。中国丢掉了“世界第一人口大国”的帽子,马路上娃娃车...
缓解亏损压力,消息称Meta明... IT之家 5 月 30 日消息,科技媒体 The Information 今天(5 月 30 日)发...
原创 大... " 作者丨追命 编辑丨坚果 封面来源丨Unsplash " 近日,刘强东的“兄弟论”又一次刷屏。...
美国软件股逆袭,创2001年以... Snowflake与Okta强劲财报提振情绪,市场对AI颠覆软件行业的极端悲观预期开始松动。 Sno...
原创 5... 一夜之间,黄金价格犹如经历一场惊心动魄的“踩踏”,重重跌破了4500美元/盎司的心理大关,昔日被视为...
德康农牧(02419.HK)获... 格隆汇5月29日丨根据联交所最新权益披露资料显示,2026年5月28日,德康农牧(02419.HK)...
37岁公司董事长、车手张秀军比... 每经编辑|何小桃 5月29日,2026中国环塔国际拉力赛组委会发布通告:5月26日,在2026中国...
原创 人... 观察者网报道,本周在纽约经济俱乐部的一场专题讨论会上,加拿大总理卡尼发表了一番引发广泛关注的讲话。这...
反复尿路感染别只吃消炎药 很多人尿频、尿急、尿痛一发作,就自行购买消炎药服用,症状消失就立刻停药,这是尿路感染反复发作的主要原...
原创 散... 最后再说一遍:散户对白酒、地产的理解是大错特错了…… 投资是投资,现实是现实,行业是行业,大家必须分...
从Vinexpo Asia 2... 5月26日至28日,Vinexpo Asia – Be Spirits – Be No 2026亚洲...
原创 金... 今天去商场转了一圈,金店柜台前的人比上个月少了很多。 看了下当天挂牌价,东方大国黄金的首饰金报在13...
消费资产今日全线回暖,港A两套... 今日消费板块呈现明显回暖态势,港股新消费龙头表现抢眼。 泡泡玛特(09992.HK)、 安踏体育(0...
滴滴开放日走进判责客服:讨论纠... 5月28日,滴滴开放日在大连客服职场举办。活动聚焦“体验与服务”,邀请司机、乘客、媒体、行业专家等各...
中餐出海进阶:狂飙过后,该算账... 近几年,随着出境游热度攀升,越来越多的国人发现,不管是东南亚的市井街头,还是欧美的核心商圈,总能轻易...
A股“芯”征程:5%科技龙头虹... A股上演“冰火两重天”:一边是白酒、地产等传统“核心资产”持续遇冷,一边是芯片、半导体等新兴题材不断...
上海大模型龙头,启动A股上市! 来源:智东西 新一代旗舰模型也即将发布。 作者 | 陈骏达 编辑 | 李水青 智东西5月30日报道...
MiniMax正式启动A股IP... 据证监会官网IPO辅导公示系统显示,MiniMax已向上海证监局提交A股IPO辅导备案,中信证券担任...
三重利好共振推动港股内房股反弹... 5月29日,港股内房股显著拉升, 碧桂园(02007.HK)涨幅超38%, 融创中国(01918.H...
利空突袭,全线大跌!马斯克,紧... 在IPO前夕,马斯克的SpaceX突遭“拉黑”。 据最新消息,丹麦养老基金AkademikerPen...