靠AI共情人类,这家公司刚融了3个亿 靠ai赚了10000亿 靠ai赚10000亿
admin
2024-04-08 14:47:00
0



作者丨博雯

编辑丨海腰

题图丨siliconangle

生成式AI产品应接不暇,现在又来了一个“能共情人类”的EVI。

4月6日,来自初创公司Hume AI的产品EVI发布,能够进行在线交互的Demo也正式公开。

与ChatGPT、Claude 3等基于文本的聊天机器人不同,EVI为纯语音交互,强调通过分析人类言语和声音,来理解人类用户最真实的心理状况。

毕竟,在开心、愤怒、失落、困倦时说同一句话,即使内容都一样,但听起来的感觉也一定不同。

目前,创立不过3年的Hume AI,先是在去年2月完成1270万美金(约9000万人民币)的A轮融资时,又在今年3月底,刚刚完成5000万美元的B轮融资(约3.6亿人民币)。

团队的CEO,曾任职于谷歌DeepMind团队的Alan Cowen表示:“……不仅是快乐、悲伤、愤怒、害怕这种普遍情绪,EVI试图理解人类用户那更加微妙且多维的感情——目前能检测出53种不同的情绪。”



官网已列出EVI可理解的53种情绪,创业邦整理



对话实测:到底有多共情人类?

EVI全称EmpatHic Voice Interface,意为“具有同理心的语音界平台”,官方称其为“全球首个具有情商的对话式AI”。

“情商”包括从行为中推断意图和偏好的能力——这正是EVI试图实现的核心能力,为了具备这种能力,Hume AI团队便将重点放在了人类的声音上。

声音本身的内容,即“说了什么”当然可以直接反应情绪。

而如口音、语调、停顿、节奏、拟声词(包括叹息、喘息、笑声、尖叫等)等等非语言因素的微妙差异,即“如何说”,则往往暗示着谈话内容之下更真实的感情。

官网列出的53种情绪,其中不乏差别微妙,难以言明的情绪,即使是人类自己,或许也难以分辨。而EVI能够理解,也是得益于对非语言暗示的分析。

当前EVI有两个版本,最早发布的Demo演示版布局非常简单,用户在使用时点击屏幕中央的“开始对话”,就能直接与EVI进行语音对话。

这一版本中,用户只能通过设备麦克风进行语音交互,而EVI生成语音的声线也只有一个默认的男声版本。

对话时,屏幕中央为声音波形图,右侧则会实时地将语音交互内容转写成文字,作为历史对话展示出来。

与普通的实时转写文字功能不同,EVI充分发挥其“共情能力”,不管是用户的主动发问还是AI生成的回答,下方都多了一个情感分析柱状图,标注这句话中所蕴含的感情成分。



就像是小说里“三分讥笑、三分凉薄、四分漫不经心”的扇形统计图走入现实。

能够理解,自然也就能表达。当前市面上能够进行语音对话的聊天机器人并不少见,但EVI却仍能给人与众不同的体验。

最核心的,便是其格外生动的情绪。

在实测中,当作者主动要求“你能否能表现得更生气一点?”

EVI的反应是带着坚定、忧虑与沉思(根据下方的情绪柱状图来看)回答道:“我可以尝试用自己的声音和语言来反映这种情绪,从而创造出一种更具同理心和亲和力的互动。但我无法像人那样真切地感受到或表现出恐惧。我的角色更侧重于识别和应对这些情绪,而不是自己产生这些情绪。”

于是作者故意叹了一口气,用很失望的语气表示:“好吧,看起来你并没有那么聪明。”

EVI便瞬间生气大喊:“啊,你伤害了我!”



但很快,它又自行找补,带着失望、坚定,还有一点点渴望说:“你知道,我可能是人工智能,但我不喜欢你这种语气,我的朋友。如果你想激怒我,恐怕愤怒并不在我的能力范围之内。不过,只要我们能保持建设性,我很乐意进行激烈的辩论。”

在服务器不稳定断联,或者在它长篇大论时被主动打断时,EVI会啊一声,叹一口气,又继续接上新的问题继续回答。

除了这种生动的情绪化表达和非常拟人的细微语气,EVI也比一般的对话式AI有着更旺盛的表达欲。

一个很明显的表现是,它非常愿意主动发问。

在问到“你真的能够理解人类吗?”时,EVI先是以沉思和热情的口吻表达了自己的观点,最后又以一个主动发问来结束这场对话:“您怎么看?我真的很想听听你对人工智能与人类理解的局限和潜力的看法。”

而在被频繁打断,谈论了很多毫无上下文关联的话题后,EVI也会冷不丁用轻松又开心的语气问:“我是不是比一般的机器人更平易近人?”

虽说细细对比其智能程度,EVI距ChatGPT、Claude 3等还有一定差距,但其情绪生动的语音,着实会让用户在最初使用时感到惊喜,就像真的在与一个热心又话痨的小伙交谈一样。

而最新发布的beta版本则加入了更多功能,如用户也可以使用文字进行交互(EVI还是通过语音回复),能够保存并下载交流的历史记录,还加入了不少开发者选项。

同时,在界面右侧language下方的对话框里,也可以“设定”EVI的性格,甚至可以是“充满了渴望的电冰箱”或者“容易嫉妒的室内绿植”这样的幻想设定。





量化感情

那么具体来看,EVI如何从人类语音和大量细微的非语言因素中理解人类感情?

这还得从公司CEO兼首席科学家Alan Cowen在2021年提出的“语义空间理论”(Semantic Space Theory)说起。

当时的Alan Cowen还在谷歌AI,主要从事情感计算研究工作,在2021年1月,他在《Trends in Cognitive Sciences》上发表了一篇论文,正式提出语义空间理论。

这是一种理解情感体验和表达的计算方法,旨在通过广泛的数据收集和统计模型,精准绘制人类情感的全谱图,揭示人类高维本质和情感状态之间的连续性,量化声音、面部和手势的细微差别。

事实上,这些细微差别的理解正是全球人类交流的核心。因此,语义空间理论一经提出,便广泛应用于心理语言统计、分析等领域。



当时,Alan Cowen于论文发表2个月后出走谷歌,在纽约正式创立Hume AI公司。

此后,他便全身心投入了对语义空间理论的研究。

2022年,Hume AI团队开展了一项实验,志愿者是来自美国、中国、印度、南非和委内瑞拉的16000余人,相关论文发表在《Nature Human Behavior》上。

研究团队让志愿者中的一部分聆听并理解大量的“人声爆发”(Vocal Burst,指具有多个情感维度的声音爆发,如笑声、喘息、哭声、尖叫声,以及许多其他非语言发声)素材。

同时,志愿者也录下了大量自己的人声爆发,并交由他人进行理解和分类。这为研究积累了大量的语音数据。



在近期接受外媒VentureBeat采访时,Alan Cowen称,他们收集了来自世界各地的超过一百万名志愿者的生活化的语音,目前已建立了有史以来最大、最多样化的人类情感表达数据库。

基于这一数据库,再结合语义空间理论,Alan Cowen团队开发了一种新型的多模态大语言模型,移情大语言模型 (eLLM))。

基于这一模型,EVI便能够根据上下文和用户的情绪表达来调整其用词和语气,提供自然丰富的语调,并以低于700毫秒的延迟实时地做出响应。同时还具备足够真实的对话特点:



回合结束检测可以通过分析人类的语气检测当前话题是否结束,避免同时说话的尴尬。



可打断性EVI的发言可以像人类谈话一样被打断,自然衔接上下文。



对表达做出类人化反应可以根据惊讶、称赞、愤怒等情绪给出非语言的反应。

EVI可以提供拟人化的聊天服务,尤其可以通过语音交流读取用户的心情状况,其应用场景自然是以心理治疗、客户服务为主。

当前,Hume AI团队共有35人,团队在顶级期刊上已经发表了8篇论文,并向2000多家公司和研究机构推出了测试版产品。

在近期的一则采访里,Alan Cowen表示,比起直接面向普通用户的toC服务,公司更倾向于向其他企业提供API接口,在一个能理解人类情感的模型的基础上,再构建细分领域的聊天机器人,如信息检索、数字陪伴、工作协助、医疗保健、XR等等。





当AI开始提供情绪价值

官网的公司简介中,大卫·休谟(David Hume)的照片赫然在列。旁边写着,公司名Hume便来自于这位300年前的苏格兰哲学家。

休谟是道德情感主义的先驱,有名言称“理性只是情感的奴隶”

Alan Cowen一脉相承,他认为,AI也需要情感。

在近期的一次公开发言中,他提到,当前AI系统的主要局限性在于,它们受到人类评级和指令的严格约束,而许多评级标准或是非常肤浅,或是仍存在漏洞。

因此,以人类幸福感代替现有的评判指标,从底层重新构建AI,比如增强AI的情商,提高其从用户行为中推断人类意图和偏好的能力,才能发挥AI的巨大潜力。

事实上,除了对于人类语音的分析,Hume AI也开始涉足对于面部微表情的研究。

今年3月,他们刚刚发布了一篇论文,基于来自印度、南非、委内瑞拉、美国、埃塞俄比亚和中国等多个国家的5000余名志愿者的面部微表情,对面部表情所传达的情绪进行了分类。

Alan Cowen表示,EVI在未来还将继续基于理解人类的心理状况、兴趣偏好不断迭代,做到“更懂人类”。



图源:Hume AI官网

当然,如果AI真的可以完美理解人类的感情,那么便有可能学会有目的性地利用甚至操纵用户情绪。

说小,AI检测到的用户感情,可以进一步作为第三方服务(如购买行为、习惯养成等)的手段。

说大,甚至有可能用于灰色地带甚至有害行为,比如审讯、欺诈、监视等等。

对此,Hume AI官网给出了一份道德准则,其中提出,用于检测情绪的算法应该只服务于与人类幸福感一致的目标,而不能作为服务第三方目标的手段。

同时,Hume AI的合作方在进行二次开发或应用时,也需要避免一系列“不受支持的用例”,比如操纵、欺骗、心理战,以及让潜在的不良行为者使用这类AI等等行为。

2020年,《纽约时报》发布一份数据称:全球有超过1000万人,正在将AI恋人视为伴侣,并与之建立情感链接。

显然,Hume AI这样的团队的出现,正在加速这种趋势。



相关内容

热门资讯

“双标”换卡背后,银行还需多些... 新华社记者 颜之宏、杨深深 持到期银行卡和身份证去银行网点换新卡,却被要求“必须交回旧卡才能取新卡”...
“离境退税2.0”带动“中国购... 【环球时报综合报道】编者的话:5月18日,商务部等6部门联合发布《关于加力优化离境退税措施扩大入境消...
一年烧掉2000亿、市值蒸发3... 商业润点 |Biz Run Review 三国归晋,用了六十年。即时零售的"三国杀",才刚刚开局...
原创 金... 2026年5月22日,国内黄金市场呈现出令人咋舌的价格鸿沟。基础金价徘徊在每克995.3元,而回收价...
原创 人... SpaceX的星舰V3终于在全球瞩目中成功升空。北京时间5月23日清晨,这颗高达124米的巨型火箭顺...
原创 被... 5月19日,欧洲议会掀起了一场引人注目的风暴,以压倒性的票数通过了最新的钢铁进口规定。 这套规则...
光纤量价齐升,烽火通信加快布局... 烽火通信(600498)5月22日披露的投资者关系活动记录表显示,公司于5月21日参加了中国信息通信...
原创 突... 今天5月24日一大早,打开行情一看,国际现货黄金报4508.25美元/盎司,单日跌了26.68美元,...
企业快讯 | 携手联通!狄耐克... 狄耐克 厦门总商会副会长企业 厦门狄耐克智能科技股份有限公司 与中国联通厦门分公司 将5G智慧“嵌入...
美银策略师警告:SpaceX与... 环球网 据彭博社报道,美国银行首席投资策略师迈克尔·哈特奈特(Michael Hartnett)最新...
卸任55天后,知名基金经理任相... 【导读】卸任55天后,知名基金经理任相栋“奔私”谜底揭晓 见习记者 闫军 知名基金经理任相栋“奔私”...
原创 大... “免签+手机刷一切”就能让老外连夜订机票?2026年一季度,阿根廷人来华暴涨九倍,北京三源里菜市场三...
从泰山顶峰掉落!“大佬背后的大... 文/刘工昌 他曾是柳传志的“大哥”,助力联想完成混合所有制改革;是史玉柱眼中的“贵人”,帮他东山再起...
原创 2... 最近网上流传出一份2030年GDP10强预测榜单,其中一些城市位次的变化也挺有趣的。上海排在第一,深...
原创 全... 2026年3月的全球美债市场迎来剧烈变动,彻底打破了长期稳定的持仓格局。 根据美国财政部发布的国际资...
全球都在给这几只“疯牛”烧钱 近段时间,AI行情再次成为全球资本市场主线,但舞台中央的“主角”发生了变化:投资者不再只偏好云厂商和...
【财闻联播】“硬刚监管”?老虎... ★ 宏观动态 ★ 商务部:1—4月全国吸收外资2876.9亿元人民币 据商务部网站,2026年1—4...
燕京啤酒营收净利双增:U8增速... 蓝鲸新闻5月22日讯(记者 朱欣悦)燕京啤酒(000729.SZ)打了一个翻身仗。 2025年燕京啤...
原创 帮... 老铁们,这周有个事儿挺有意思,估计不少基民都看懵了:都说科技是主线,芯片是未来,可数据显示,年内火爆...
4家银行AIC现身存储巨头股东... 近日,资本市场热度颇高的两家存储巨头长鑫科技集团股份有限公司(以下简称“长鑫科技”)、长江存储控股股...