实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑停不下来 讯飞星火v3.0学习机 讯飞星火v15发布三大能力惊艳升级
admin
2024-02-04 15:56:59
0

白交 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。

今天,2024刚开年,讯飞星火就迎来重大升级:

讯飞星火V3.5整体接近GPT-4 Turbo数学、语言理解、语音交互能力超过GPT-4 Turbo;代码达到GPT-4 Turbo 96%;多模态达到GPT-4V 91%。



尤其在语音交互功能上,超逼真的真人语音生成,直接让线上网友惊叹三连:





还有更多实用功能,比如现场几十秒的时间生成22页PPT!这速度,很快啊……



而围绕着这个大模型底座,科大讯飞还有一揽子产品和场景应用输出。

国产首个语音大模型星火开源大模型“星火开源-13B”讯飞翻译机升级面向教育行业的智慧黑板

从基础模型到应用场景,下面一起来看。

讯飞星火V3.5底座能力升级

讯飞星火V3.5除了七大能力全面提升,整体能力接近GPT-4,还特别在语言理解、数学等能力上实现超越。

尤其对中文的理解更占优势,具体数据对比如下:

语言理解、数学能力超过GPT-4 Turbo;代码打到GPT-4 Turbo 96%;多模态理解达到GPT-4V 91%

如果看数据图表还不够直观,我们也提前实测了一番。

就拿此次网友最为称道,也是本次更新最大的亮点——全语音交互,不是语音消息那样一条一条的,而是像打电话一样实时交互,下面先来看一段视频演示:

星火这一波应对得怎么样,算不算得上高情商?

要注意视频没有做加速处理,讯飞星火V3.5的语音响应就是这么快,与ChatGPT的语音交互相比,省去了大量“等待AI思考”这个环节,整个对话过程更流畅。

“聆飞逸”、“聆小玥”分别对应男女声两种音色,可自由切换。在音色自然,还像人一样时不时有停顿、“嗯……”等语气词。

在有感情,拟人度等方面,对比ChatGPT的“Ember”、“Juniper”音色也不遑多让。



在交互模式上还设计了“一键打断”功能,避免AI生成在一轮对话中内容过长。



打断后,可继续提问下一个问题,也可以直接“挂断”语音,切回到文字模式,看到刚刚整个对话过程的文字版。



除此之外,在其他能力表现上,我们先用一个经典挖坑题来考验。

结果讯飞星火V3.5不但回答了最后的问题,还没有被前面无关的信息绕进去,每一个不合理之处都被揪出来了。

做到这一点不仅需要推理问题中的文字逻辑,还要结合大模型在训练阶段学到的关于现实世界的知识。




对比GPT-4,除了格式不同,推理能力、知识水平可以算是在一个level了。

另外也可以推测,由于要兼顾语音表现,讯飞星火的回答总是一串连贯的句子,而GPT-4更注重视觉排版。



时效性方面,提问最新网络流行梗,星火也是能跟得上潮流的。




相比之下,GPT-4现在虽然默认也有联网功能,但不经特意提醒不会意识到回答这个问题需要联网搜索,而是开始了传统艺能“一本正经瞎编”。



而在更实用场景功能升级,比如学习、办公等场景,也是讯飞星火一直以来的迭代重点。

比如在知识学习和内容创作方面。

发布会现场,只截取一段简单的新闻,就能提出问题,并且根据问题进行回答。

关键的是,里面回答的内容原文并没有。但它却能根据问题旁征博引、扩充内容。



在PPT创作上,在确定主题、提纲以及内容的过程中,可以随时补充内容、精准生成。



而在更多像工业、数智化的生产力场景中,对大模型的逻辑推理、空间理解、多模态等方面的能力都提出了更大的考验。

此次星火V3.5也得到了一定的增强。



比如在多模态和空间理解能力上,只给了一张图,也没有更多提示(只说分析这张图片)。结果它直接判断:这是一个室内平面布局图,并且进一步准确给出房间、家居位置。



除此之外,还可以帮忙设计装修图,并且根据自己的需求精细可控。

ps.你能看出这两个有什么不同吗?(提示:看后面的风格画)。



总的来说,讯飞星火V3.5这次升级,在模型基础能力、实用性、交互模式上都有提升,也带领中国大模型行业进一步朝世界先进水平看齐。

不过在这幕后,还有一件更值得关注的进展。

这次讯飞星火V3.5能力升级,同时也是“飞星一号”平台能力的首秀。

这是讯飞与华为共建的大模型算力平台,基于华为昇腾生态,实现了纯国产化算力。

在“飞星一号”平台首次对外宣布之时,刘庆峰曾表示“中国现有的大模型跟GPT4比还有差距,所以我们必须正视今天和GPT4的差距,找到差距所在。”

如今在“飞星一号”平台正式投入使用后,这个差距正在逐渐缩短。



不仅如此,一个完全国产化、自主可控的算力底座,在保障网络信息安全基础上,还能更好地满足国内各行各业的需求,以及支持开发者、高校、企业更好自主研发。

凭借此算力底座,除了讯飞星火V3.5,这次一同出炉的还有国产首个语音大模型。

首个语音大模型发布

借助基础大模型以及国产算力平台,此次科大讯飞在技术和生态层面,还有一揽子成果输出。

技术方面,首个语音大模型的发布

在语音技术上深耕二十余年的科大讯飞,它认为大模型给语音技术发展,包括语音合成、识别、多语种等方面带来了全新的机会。



不同于常规的语音大模型,讯飞的语音大模型将更多语音表征解耦,融入到大模型预训练中,比如语种表征、内容表征、韵律表征、音色表征。



在多语种识别中,在首批37个主流语种效果超过OpenAI Whisper 3。



并且在多语种语音生成、超拟人语音生成上,也有一定的提升。



目前语音大模型已经向开发者完全开放,并且首发搭载在讯飞翻译机上面。

除此之外,还首次发布了星火开源大模型“星火开源-13B”。据介绍,此次深度适配国产算力,并且也在昇思社区上发布,助力开发者、高校、企业自主研发。

而在应用生态层面,此次同样也干货满满。

作为拥有超过全球590万开发者生态的讯飞,继续发挥着自己的场景势能——以大模型之力,持续在千行百业中落地。

以最典型的教育场景为例。

具体在教育场景上,此次讯飞星火智慧黑板有了一定升级。

刘庆峰认为,作为改变人类未来生产生活方式的重大技术突破,优先应该为孩子赋能、为教育赋能。

老师一声上课,讯飞星火智慧黑板就开始工作。

不管是数学、化学,立体几何还是化学方程式,只需在黑板上画一下,就能识别成书面格式,并且支持编辑。

比如现场画个苯酚,结果它秒秒钟识别,并且推荐出视频科普课程。



还能使用虚拟人,辅助老师授课。



一节讲完,它还能自动存下来,课程实录、视频切片等内容都有,可以随时回顾重点。

除此之外,还有在保险、银行、能源、汽车、通信等方面的合作进展。

发布会现场,中国移动携手讯飞星火推出5G新通话创新应用“商务速记”,能够实现通话语音同步纪要,关键事项精准提炼,且无需下载APP,所有手机都支持。

其中,值得一提的是,在农业领域,科大讯飞同安徽省农业农村厅联合打造“耕云农业大模型”,并被写入安徽省政府工作报告之中。

据介绍,在最新的安徽省政府工作报告中, “讯飞星火”还被评价道:科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。

能得到这种自上而下的关注和协同合作,国内并不多见。

这与科大讯飞本身在大模型生态影响力不无关系。截至目前,讯飞星火积累了这样一份成绩单。

讯飞听见已经拥有6500万用户,讯飞星火纯用户2400万;讯飞输入法有1.4亿活跃用户;内容创作平台,讯飞智作(音视频创作),自815发布以来新增了21万会员用户,160万音视频内容;而在图文创作上,1024发布以来赋能企业用户生产百万内容。半年来,大模型开发者生态积累了35万开发者数量,其中企业开发者数量为22万。

要知道获得这样成绩的讯飞星火,距离首次发布并不足一年。

一方面,再次印证了大模型作为基础技术底座,持续释放在千行百业的应用潜力,而且迭代和落地速度只会越来越快。

去年十月,国务院发展研究中心下属的国研经济研究院开展了一项大模型行业应用能力测评研究。测评报告中显示:

星火大模型V3.0在医学、法律、教育、零售、汽车工程、计算机和工业设计平均准确率达72.3%,在所有测评行业中表现均优于GPT3.5版,并且与GPT4.0各有优劣。

而除了在行业场景中的生产势能外,此次国产语音大模型的发布同样值得关注。还记得GPT系列大模型刚出现时,关于各种技术「不存在了」的讨论此消彼长。

作为AI语音龙头,科大讯飞首次实践证明:借助大模型来推动自身语音技术积淀达到新的高度,继续引领语音技术发展。

大模型新阶段,该怎么走?

经历了2023年的百模大战,2024整个行业来到一个新的阶段。

作为国内大模型的代表玩家,科大讯飞整场发布会看下来,能看到窥见到以下三点关键趋势:

基础技术层面,推理、多模态能力成为大模型技术升级的重点攻坚方向。

此次讯飞星火V3.0的升级方向,与前段时间奥特曼剧透GPT-5有不少相似之处。

此前在奥特曼对GPT-5的零星剧透来看,推理能力是重点提升方向,尤其在代表用户处理通用任务方面有重要进步。

很快就可以问AI,我今天最重要的邮件是什么?

在产品功能上,“应用户强烈要求”,奥特曼正在考虑给ChatGPT添加视频能力,以及给语音功能提供更好的语音质量。

企业层面,大模型只是基础底座,技术公司能够借大模型来带动自身技术升级和发展。

已经明显感知到的是,当下很多讨论的技术都有一个共性,就是它并非突然涌现,而是往往存在已久,终于来到了产业大规模应用的拐点。

因此对于技术公司来说,持续保持对新技术的感知和投入,其实就能快速部署应用,帮助自身技术布局和发展。

前段时间,Meta小扎官宣“All in 开源AGI”,但实则同此前元宇宙的布局并不冲突,他们将借助大模型,进一步推进雷朋Meta智能眼镜为代表AI新型计算设备的升级。

生态层面,大模型的开放性和可扩展性正在成为推动行业生态繁荣的关键因素。

讯飞星火正吸引着更多的开发者和合作伙伴,促进技术的快速迭代和创新。基于大模型构建出各种行业应用,形成一个多元化的应用生态。这种生态的构建,有助于形成良性的技术竞争环境,推动整个行业的技术进步和应用场景的拓展。

因此我们能看到,讯飞在教育、医疗等多个垂直领域的深入应用,这些领域的应用不仅能够解决实际问题,还能够反过来进一步为大模型提供丰富的数据支持,进一步优化模型性能,实现升级迭代的正向循环。

这也是讯飞一次次敢于在重要时间节点提前“立下Flag”,又能准时带着最新进展回来兑现承诺的底气所在。

这一次,刘庆峰再次立Flag:今年上半年达到GPT-4现在水平

而更长期的目标在于通用大模型持续对标、行业应用实现超越、自主可控生态繁荣



2024年才刚刚开始,对于这一年以讯飞星火为代表的AI技术又将给人们生活带来哪些变化,你怎么看?

相关内容

热门资讯

原创 印... 2025年11月,印度五大炼油企业在制裁截止日11月21日之前,大规模囤积俄罗斯石油,在12月份没有...
收评:创业板指探底回升涨超1%... 【收评:创业板指探底回升涨超1% 商业航天概念爆发】财联社1月22日电,市场午后震荡回升,三大指数集...
富国消费主题混合C基金近3年单... 近期,富国基金旗下富国消费主题混合基金的表现引起市场关注。 富国消费主题混合基金成立于2014年12...
宏利基金被曝与特斯拉存在诉讼 ... 近期,上海市高级人民法院披露的一则开庭公告显示,特斯拉(上海)有限公司已起诉宏利基金管理有限公司(下...
95亿消费电子大佬,拟“接盘”... 雷达财经出品 文|丁禹 编|孟帅 1月20日,港股上市公司 TCL电子联手索尼,抛出一则震动消费电子...
TikTok美国出售交易预计本... 据美国数字新闻媒体SEMAFOR报道,中美双方已达成协议,以美国投资者为主的财团将参与TikTok美...
金饰克价,1500元!“轻黄金... 近日,首饰黄金每克报价突破1500元引发热议。1月22日,中国证券报记者走访北京地区多家品牌金店看到...
2025年离境退税销售额同比增... 2025年,上海入境游迎来强势增长,全年累计接待入境游客创历史新高,达到936.02万人次,同比大幅...
邵东市举办“讲台育桃李,健康护... 大众卫生报·新湖南客户端1月20日讯(通讯员 曾秀丽 罗邵陵)为提升女性健康素养,强化自我保护意识,...
华翔股份大宗交易折价成交67.... 华翔股份01月22日大宗交易平台共发生4笔成交,合计成交量67.50万股,成交金额1150.88万元...
年内已经上涨37%,明早的英特... 今年以来,英特尔股价累计涨幅已达37%,1月21日收盘价报54.25美元,创2022年1月以来新高。...
阿里巴巴股价突然直线拉升,市值... 北京时间1月22日晚,阿里巴巴美股直线拉升,股价站上180美元,创去年11月以来新高。截至发稿前阿里...
泓德红利优选混合(LOF)A:... AI基金泓德红利优选混合(LOF)A(501227)披露2025年四季报,第四季度基金利润249.8...
金饰克价,逼近1500元! 在地缘局势紧张加剧 市场风险规避情绪高涨背景下 现货黄金以及黄金和白银期货价格 20日大幅上涨 再创...
三个月涨近1000美元,盘点黄... 近期,投资者的担忧情绪持续升温。无论是债券收益率走低、股市估值高企,还是特朗普的政策不确定性,都让他...
净利润16.1亿元左右 210... 今日聚焦 【兆易创新:2025年净利同比预增46%左右 存储行业周期稳步上行供需结构优化推动产品价量...
IPO雷达|惠康科技遭暂缓审议... 深圳商报·读创客户端记者 宁可坚 1月22日晚间,据深交所官网,宁波惠康工业科技股份有限公司(简称“...
大寒节气别瞎吃:学会这几招,轻... 寒冬已至,转眼就到了今年的最后一个节气——大寒。和小寒差不多,大寒时节通常是指寒冷到极致的天气。这个...
不到两月,卖爆300万!老牌肉... 从“朱泾方肉”到“唐小厨”食养产品,一家老牌肉企的健康突围与新赛道试验 在快速更迭的消费市场中,食品...
广州2025“拿地冠军”背后的... 2025年广州经济走出了U字形反弹的良好势头。同时,与上下游数十个产业紧密关联的房地产市场,亦在持续...