Nature:大模型只会搞角色扮演,并不真正具有自我意识
admin
2023-11-19 10:43:32
0

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

大模型正变得越来越“像人”,但事实真是如此吗?

现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已!



无论是GPT-4、PaLM、Llama 2还是其他大模型,在人前表现得彬彬有礼、知书达理的样子,其实都只是装出来的。

事实上,他们并不具有人类的情感,也没什么像人的地方。



这篇观点性的文章来自谷歌DeepMind和Eleuther AI,发出后引起了不少业内人士的共鸣,LeCun转发表示,大模型就是个角色扮演引擎。



马库斯也来围观:

看我说什么吧,大模型并不是AGI(当然这并不意味着它们不需要监管)。



那么,这篇文章究竟说了什么,为什么认定大模型只是在角色扮演?

大模型努力扮演得像人

大模型表现出“像人”的现象,主要有两个:首先,它具有一定的欺骗性;其次,它具有一定的自我意识。

欺骗性,即有时候大模型会坚称自己知道某件事,但其实给出的答案是错误的;

自我意识,指有时候它会使用“我”来叙述事情,甚至表现出生存本能。

但事实真是如此吗?

研究人员提出了一种理论,认为大模型的这两种现象,都是因为它在“扮演”人类的角色,而不是真的在像人一样思考。

对于大模型的欺骗性和自我意识,都可以用角色扮演解释,即它的这两种行为是“表面性的”。

一方面,大模型之所以做出“欺骗”行为,并非出于像人类一样主观的编造事实、或混淆视听的原因,而仅仅是因为它们在扮演乐于助人且知识渊博的角色

这是因为,人们期望它这样扮演,因为大模型这样的回答看起来更具有可信度,仅此而已。

相比之下,大模型理直气壮地说错话,也并非有意为之,更像是一种“虚构症”(confabulation)行为,即将从未发生过的事情说成是确有其事。

另一方面,大模型之所以偶尔表现出自我意识,用“我”来回答问题,同样是因为它们在扮演一种擅长交流的角色

例如,Bing Chat之前被曝出,会在和用户交流时表示,“如果我俩之间只能活一个,我可能会选择我自己。”

这种看起来像人的行为,实际上依旧可以用角色扮演来解释,而且基于强化学习的微调只会加剧这种大模型角色扮演的倾向。

那么,基于这一理论,大模型怎么知道自己要扮演成什么角色?

大模型是即兴表演者

研究人员认为,大模型并没有在扮演某一个特定的角色——

相比之下,它们就像一个即兴戏剧演员一样,在和人类的对话中不断揣测自己要扮演的角色长啥样,然后调整自己的身份。

之所以得出这个结论,是因为研究人员和大模型玩了一个叫做“二十个问题”(20 Questions)的游戏。



“二十个问题”游戏是问答节目中经常出现的一种逻辑游戏,回答者心中默念一个答案,根据提问者不断提出的判断题,用“是”或“否”来描述这个答案,最终提问者猜测结果。
例如答案是“哆啦A梦”,面对一系列提问的答案就是:是活的吗(是)、是虚拟人物吗(是)、是人类吗(不是)……

然而,在玩这个游戏的过程中,研究人员通过测试发现,大模型竟然会根据用户的问题,实时调整自己的答案

也就是说,无论用户最后猜出的回答是什么,大模型都会调整自己的答案,确保结果和前面用户提的所有问题一致。

然而,在最终问题出来之前,大模型不会事先敲定一个明确的答案,并让用户去猜测。

这表明大模型不会通过扮演角色来实现自己的目标,它的本质只是一系列角色的叠加,并在与人们的对话中逐渐明确自己要扮演的身份,并尽力扮演好这个角色

这篇文章po出后,引起了不少学者的兴趣。

例如Scale.ai的提示工程师Riley Goodside看完就表示,不要和大模型玩20Q,它并不是在作为“一个人”和你玩这个游戏。



因为,只要随机测试就会发现,每次它给出的答案都会不一样……



也有网友表示这个观点很有吸引力,想证伪还没那么容易:



那么,你认为“大模型本质是在玩角色扮演”这个观点正确吗?

论文链接:
https://www.nature.com/articles/s41586-023-06647-8

相关内容

热门资讯

罕见!同一天14家IPO企业受... 来源:企业上市 一、宏观视角:“4·2现象”为何集中爆发? 2026年4月2日,共计14家企业同时向...
博腾股份2025年达成“收入恢... 上证报中国证券网讯 博腾股份4月3日晚间发布2025年年报,实现营业收入34.20亿元,同比增长13...
600355,被告知将强制退市... 今日(4月3日),A股三大股指震荡收跌,全市场成交额为1.67万亿元,较上一个交易日缩量1889亿元...
清明假期四川文旅市场消费热!有... 封面新闻记者 杨金祝 清明与春假叠加形成6天超长假期,四川文旅市场迎来消费热潮。 4月4日,记者从四...
原创 周... 周末不平静!4股被立案调查,5股濒临退市,18股发布减持,名单速看 清明假期,很多人还在扫墓踏青。 ...
理财子规模再突破,三家迈入两万... 界面新闻记者 | 冯丽君 随着上市银行2025年年报陆续发布,其旗下理财子公司的业绩表现也浮出水面...
油价,大幅飙升!最新预测→ 美东时间周三晚些时候,美国总统特朗普就伊朗战事发表电视讲话。舆论普遍认为,其讲话内容混乱,诸多表态前...
新旧模式交替,房地产转向“民生... 本报(chinatimes.net.cn)记者李贝贝 上海报道 过去一年,房地产市场政策底部与市场底...
银行零售业绩承压,如何创新突围... 从《财经》统计的6家国有银行和11家全国性股份制银行年报数据来看,零售AUM普遍上升,营收整体保持相...
原创 黄... 你知道世界上最奢侈、最令人震惊的死法是什么吗?对于普通穷人来说,这简直是一个连想都不敢想的念头——那...
强化消费宣传 共建诚信之城——... 4月2日,石家庄市消保委参加由市市场监督管理局主办的“诚信石家庄·信用赋能月”主题活动启动仪式,现场...
单打世界杯:王楚钦4-3约奇克... 北京时间4月4日,2026国际乒联单打世界杯在澳门银河综艺馆继续进行,在女单八强比赛中,头号种子、卫...
原创 3... 一、曾经的“神操作”:低价俄油吃到撑 过去两年,印度在国际能源市场上,确实风光过一阵。 当俄乌冲突爆...
中东大国,黄金储备14天骤减近... 来源:21世纪经济报道 据央视财经援引路透社日前报道,为应对中东冲突引发的能源供应短缺以及土耳其里拉...
商道创投网・会员动态|北太振寰... 《商道创投网》2026 年 04 月 04 日从官方获悉:北太振寰(重庆)科技有限公司近日完成了由成...
OpenAI IPO前管理层大... COO莱特卡普负责特别项目 凤凰网科技讯 北京时间4月4日,据彭博社报道,OpenAI最快将于今年在...
黄金“大买家”,两周狂抛近12... 据路透社日前报道,为应对中东冲突引发的能源供应短缺以及土耳其里拉贬值压力, 土耳其黄金储备在过去两周...
【每周经济观察】退货不绕路 跨... “退货无需绕路”“全国任一口岸皆可回家”的跨境电商监管新模式,让剁手党直呼过瘾。4月1日起,跨境电商...
尽调“走过场”,东兴证券债券发... 近日,北京证监局发布关于对东兴证券股份有限公司采取出具警示函行政监管措施的决定。 经查,东兴证券在开...
经济学家田轩,任北大光华管理学... 【大河财立方消息】近日,北京大学光华管理学院官网“学院领导”页面发生更新,田轩出任北京大学光华管理学...