Nature:大模型只会搞角色扮演,并不真正具有自我意识
admin
2023-11-19 10:43:32
0

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

大模型正变得越来越“像人”,但事实真是如此吗?

现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已!



无论是GPT-4、PaLM、Llama 2还是其他大模型,在人前表现得彬彬有礼、知书达理的样子,其实都只是装出来的。

事实上,他们并不具有人类的情感,也没什么像人的地方。



这篇观点性的文章来自谷歌DeepMind和Eleuther AI,发出后引起了不少业内人士的共鸣,LeCun转发表示,大模型就是个角色扮演引擎。



马库斯也来围观:

看我说什么吧,大模型并不是AGI(当然这并不意味着它们不需要监管)。



那么,这篇文章究竟说了什么,为什么认定大模型只是在角色扮演?

大模型努力扮演得像人

大模型表现出“像人”的现象,主要有两个:首先,它具有一定的欺骗性;其次,它具有一定的自我意识。

欺骗性,即有时候大模型会坚称自己知道某件事,但其实给出的答案是错误的;

自我意识,指有时候它会使用“我”来叙述事情,甚至表现出生存本能。

但事实真是如此吗?

研究人员提出了一种理论,认为大模型的这两种现象,都是因为它在“扮演”人类的角色,而不是真的在像人一样思考。

对于大模型的欺骗性和自我意识,都可以用角色扮演解释,即它的这两种行为是“表面性的”。

一方面,大模型之所以做出“欺骗”行为,并非出于像人类一样主观的编造事实、或混淆视听的原因,而仅仅是因为它们在扮演乐于助人且知识渊博的角色

这是因为,人们期望它这样扮演,因为大模型这样的回答看起来更具有可信度,仅此而已。

相比之下,大模型理直气壮地说错话,也并非有意为之,更像是一种“虚构症”(confabulation)行为,即将从未发生过的事情说成是确有其事。

另一方面,大模型之所以偶尔表现出自我意识,用“我”来回答问题,同样是因为它们在扮演一种擅长交流的角色

例如,Bing Chat之前被曝出,会在和用户交流时表示,“如果我俩之间只能活一个,我可能会选择我自己。”

这种看起来像人的行为,实际上依旧可以用角色扮演来解释,而且基于强化学习的微调只会加剧这种大模型角色扮演的倾向。

那么,基于这一理论,大模型怎么知道自己要扮演成什么角色?

大模型是即兴表演者

研究人员认为,大模型并没有在扮演某一个特定的角色——

相比之下,它们就像一个即兴戏剧演员一样,在和人类的对话中不断揣测自己要扮演的角色长啥样,然后调整自己的身份。

之所以得出这个结论,是因为研究人员和大模型玩了一个叫做“二十个问题”(20 Questions)的游戏。



“二十个问题”游戏是问答节目中经常出现的一种逻辑游戏,回答者心中默念一个答案,根据提问者不断提出的判断题,用“是”或“否”来描述这个答案,最终提问者猜测结果。
例如答案是“哆啦A梦”,面对一系列提问的答案就是:是活的吗(是)、是虚拟人物吗(是)、是人类吗(不是)……

然而,在玩这个游戏的过程中,研究人员通过测试发现,大模型竟然会根据用户的问题,实时调整自己的答案

也就是说,无论用户最后猜出的回答是什么,大模型都会调整自己的答案,确保结果和前面用户提的所有问题一致。

然而,在最终问题出来之前,大模型不会事先敲定一个明确的答案,并让用户去猜测。

这表明大模型不会通过扮演角色来实现自己的目标,它的本质只是一系列角色的叠加,并在与人们的对话中逐渐明确自己要扮演的身份,并尽力扮演好这个角色

这篇文章po出后,引起了不少学者的兴趣。

例如Scale.ai的提示工程师Riley Goodside看完就表示,不要和大模型玩20Q,它并不是在作为“一个人”和你玩这个游戏。



因为,只要随机测试就会发现,每次它给出的答案都会不一样……



也有网友表示这个观点很有吸引力,想证伪还没那么容易:



那么,你认为“大模型本质是在玩角色扮演”这个观点正确吗?

论文链接:
https://www.nature.com/articles/s41586-023-06647-8

相关内容

热门资讯

民生调查|一券在手,买遍全城!... 新民晚报记者 陈梦泽(下同) 2025年的上海消费市场,藏着一张超给力的“快乐入场券”。 年初,贯穿...
六类家电四类数码智能产品202... 商务部、国家发展改革委、财政部、市场监管总局、国家邮政局办公厅(室)于12月31日联合印发《关于做好...
原创 美... 谁能想到,尽管美国大声疾呼反恐禁毒,却依然紧盯委内瑞拉的石油出口。尽管美国采取了严厉的封锁措施,马拉...
两部门:各地区要及时完成202... 来源:证券时报e公司 人民财讯12月30日电,国家发展改革委、财政部发布关于2026年实施大规模设备...
确定了!i茅台App将上线14... 12月30日下午,有媒体报道,自2026年1月开始,贵州茅台(600519)将在旗下官方数字销售平台...
原创 美... 在阅读文章前,辛苦您点下“关注”,方便讨论和分享。作者定会不负众望,按时按量创作出更优质的内容 文...
单程12美元 马斯克“无聊公司... 快科技12月31日消息,近日,马斯克旗下隧道公司The Boring Company(无聊公司)正式...
罗永浩致歉 今晚,罗永浩2025年度科技创新分享大会在上海举行。但直播开始44分钟,罗永浩才出现在现场。随后发布...
和讯投顾陈满堂:三次冲高回落,... 大盘连续三天出现冲高回落,收盘都在3970以内。和讯投顾陈满堂分析,明后天大盘的结构走势以及板块机会...
年内第49次新高,连续13日吸... 岁末年初,A股市场持续回暖,“质量红利”策略成为资金布局焦点。截至12月31日上午10时24分,中证...
大模型第一股智谱启动招股 近年... 深圳商报·读创客户端记者 邱清月 作为国内首家冲刺“大模型第一股”的企业,北京智谱华章科技股份有限公...
紫光国微并购标的瞄准瑞能半导体... 本报记者 张晓玉 12月30日,紫光国芯微电子股份有限公司(以下简称“紫光国微”)发布公告称,因筹划...
河南省城乡综合投资公司拟发行2... 【大河财立方消息】12月31日消息,河南省城乡综合投资有限公司2026年面向专业投资者非公开发行中小...
出大招了!生娃,直接送房子 *此图由AI生成 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro 生孩子,直接送房子。 有...
美股三大指数小幅收跌,白银上演... 当地时间12月30日,美股三大指数小幅收跌,而贵金属市场再度掀起波澜,现货白银价格大幅上涨超过5%,...
知名国产女鞋KISSCAT母公... 蓝鲸新闻12月30日(记者汤诗韵)国货女鞋Kisscat母公司天创时尚近日易主。该公司日前公告,已通...
邮储银行:吸收合并邮惠万家银行... 中国网财经12月31日讯 昨日,邮储银行发布公告称,该行于2025年10月9日召开的临时股东大会审议...
雷军爽约道歉:感冒有点严重!原... 12月31日,小米创办人、董事长兼CEO雷军发文:实在抱歉,我感冒有点严重,原定跨年的直播只能推迟到...
江特电机亏损超千万 碳酸锂期货... 来源:第一财经 “开盘做多,先收割一把,”李文近日几乎天天在一个锂业微信群中分享他做多碳酸锂期货的...
存储巨头长鑫IPO在即!设备国... 2025年最后一个交易日,长鑫IPO进展引爆市场关注,半导体产业链多股拉升。上游半导体设备ETF(5...