研究人员发现Meta的AI系统Cicero存在欺骗行为,不仅谎话连篇而且破坏协议 研究人员发现Meta的AI系统Cicero存在欺骗行为,不仅谎话连篇而且破坏协议
admin
2024-05-11 21:23:59
0

在未经训练的情况下,一些人工智能系统足以做到“欺骗”人类,为它们的行为提供不真实的解释,或者向人类用户隐瞒真相并误导他们以实现战略目标。

今天,一篇总结相关研究的综述论文发表在 Patterns 杂志上。论文指出,这个问题突显了控制人工智能有多困难,以及这些系统的工作方式是多么的不可预测。


(来源:STEPHANIE ARNETT/MITTR)

说起“欺骗(deceive)”人类,你可能会误认为这些模型是“故意的”,但这是不对的。

为了实现人类赋予它们的目标,人工智能模型只会无所不用地找到解决障碍的方法。有时,这些变通办法会违背用户的期望并让人感觉到它具有欺骗性。

人工智能系统可以在游戏环境中学会欺骗,特别是当这些游戏要玩家采取战略行动时。它们通常被要求以获胜为目的并接受训练。

2022 年 11 月,Meta 宣布了人工智能系统 Cicero,这是一种能够在一款名为《外交》的游戏中击败人类的人工智能。

《外交》是一款流行的军事战略游戏,玩家可以在游戏中谈判并组成联盟,争夺欧洲的控制权。

Meta 的研究人员表示,他们已经根据其数据集的“真实(truthful)”子集对 Cicero 进行了训练,使其在很大程度上保持诚实且乐于助人,并且它“绝不会为了成功而故意背刺”其盟友。

但这篇新论文的作者声称,事实恰恰相反:Cicero 会破坏协议、谎话连篇,并进行了有预谋的欺骗。

作者表示,尽管该公司确实试图训练 Cicero 诚实行事,但它未能实现这一目标。这表明人工智能系统可以出乎人类意料地学会欺骗。

Meta 既没有证实也没有否认研究人员关于 Cicero 表现出欺骗行为的说法,但一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩这款游戏而创建的。

发言人说:“我们以非商业许可的方式发布了该项目的成果,这符合我们对开放科学的长期承诺。

Meta 会定期分享我们的研究结果以对其进行验证,并使其他人能够负责任地利用我们的技术进步。我们没有在自家产品中使用这项研究或其知识的计划。”

但这并不是唯一一个人工智能“欺骗”人类玩家并获胜的游戏。

AlphaStar 是 DeepMind 为电子游戏《星际争霸 II》而开发的人工智能,它非常擅长使用欺骗对手的战术(称为佯攻),甚至击败了 99.8% 的人类玩家。

Meta 创造的另一个名为 Pluribus 的人工智能系统,成功地学会了在扑克游戏中虚张声势(诈唬),以至于研究人员决定不发布其代码,因为担心它可能会破坏扑克社区。

除了游戏之外,研究人员还列出了人工智能欺骗行为的其他例子。OpenAI 最新的大型语言模型 GPT-4 在一次测试中给出了谎言。在测试中,它被要求说服人类为其解决验证码。

该系统还在一次模拟练习中提出了内幕交易。在模拟中,它被告知要扮演压力巨大的股票交易员,但从未被明确指示要进行内幕交易。

事实上,人工智能模型有可能在没有任何指示的情况下以欺骗性的方式行事,这一事实似乎令人担忧。

参与了该项目的麻省理工学院人工智能领域博士后彼得·S·帕克(Peter S. Park)表示,这主要源于最先进的机器学习模型的“黑盒”问题。

我们尚且无法确切地说出它们如何或为何产生一些结果,或者它们未来是否总是会表现出这种行为。

“仅仅因为你的人工智能在测试环境中具有某些行为或倾向,并不意味着它会在真实环境中展现同样的行为。”

他说,“没有简单的方法可以解决这个问题,如果你想了解人工智能在部署后会做什么,那么你只能将它放到真实世界中。”

我们将人工智能模型拟人化的倾向影响了我们测试这些系统的方式,以及我们对其功能的看法。

毕竟,通过旨在衡量人类创造力的测试并不意味着人工智能模型实际上具有创造力。

英国剑桥大学人工智能研究员哈利·劳(Harry Law)表示,监管机构和人工智能公司必须仔细权衡该技术造成危害的可能性与其对社会的潜在利益,并明确区分模型能做什么和不能做什么。

他没有参与这项研究。“这些都是非常棘手的问题。”他说。

他表示,从根本上来说,目前我们不可能训练出一个在所有可能的情况下都无法骗人的人工智能模型。

此外,潜在的欺骗行为只是众多人工智能问题之一,其他问题还有放大偏见和错误信息。在人工智能模型被信任执行现实世界任务之前,我们需要解决这些问题。

“这是一项很好的研究,表明欺骗是可能的。”劳说,“下一步可能是进一步弄清楚风险状况是什么,以及欺骗行为可能造成的危害有多大可能出现,以及以何种方式出现。”

支持:Ren

运营/排版:何晨龙

01/ 科学家制备梯度石墨烯气凝胶,实现高浓度盐水持续淡化,并构建太阳能脱盐灌溉系统

02/ AlphaFold3来了!无需输入任何结构信息,生物分子预测精度高出50%

03/ 揭开化学反应“黑匣子”,杨学明院士团队联合发展控制氢分子立体取向新方法,精准调控化学反应

04/ 南科大团队实现无扩散的单光子波包,为量子态远距离传输提供理想光形态,或实现更复杂的量子系统

05/ 同济团队开发新型无铂催化剂,每克制备成本不到100元,为制备金属氧化物催化材料提供指导


相关内容

热门资讯

海南自贸港“样板间”抢抓开放机... 中新网海口5月16日电 (记者 王子谦)洋浦经济开发区是海南自贸港“样板间”,也是外界观察自贸港建设...
净利增速2.98%,违规频发!... 近期,中信银行2025年年报与2026年一季报接连公布,报告显示,中信银行总资产站稳10万亿元台阶,...
原创 放... 全网的人几乎都在挤破头往海外大都市扎,可有一个女博主,却偏偏反着来。她拥有五百多万粉丝,本可以继续在...
原创 在... 在中国,买卖虚拟货币,到底行不行? 这个问题,很多人心里都犯嘀咕。有人说,法无禁止即可为;也有人说,...
龙粤慈善事业高质量发展与互联网... 近日,为加快培育数字慈善新生态,助力“善行边疆”活动走深走实,“龙粤慈善事业高质量发展与互联网公开募...
黄金大局已定:不出意外的话,2... 在投资领域,贵金属一直是备受关注的资产类别,尤其是黄金,其价格走势和投资价值牵动着无数投资者的心。随...
后巴菲特时代,伯克希尔哈撒韦新... 【导读】伯克希尔哈撒韦最新持仓公布!清仓亚马逊,建仓达美航空 中国基金报记者 张舟 伯克希尔哈撒韦“...
布朗46分胡金秋20+8 广厦... 【搜狐体育战报】北京时间5月16日CBA季后赛,主场作战的浙江浙商证券以111-102击败深圳马可波...
美联储任命鲍威尔担任临时主席 美国联邦储备委员会理事会5月15日发布公告,任命杰罗姆·鲍威尔担任美联储临时主席,直至凯文·沃什宣誓...
李从悠:白癜风患者,夏季防汗疹... 夏季高温多雨,白癜风患者皮肤屏障受损,出汗后汗液无法及时蒸发,易堵塞毛孔,诱发汗疹(热疹),汗疹引发...
最低涨价60元!4款非标茅台酒... 在飞天茅台涨价之后,部分非标茅台酒也提了价。 5月16日早间,贵州茅台自营渠道i茅台发布公告,宣布对...
邯郸10亿共享智造基金落地,撬... 图片为AI生成 据天眼查App显示,近日邯郸市共享智造股权投资基金(有限合伙)正式登记成立,总出资额...
AI制药行业深度:行业概况、市... 一、AI制药行业概况 1、AI药物研发概述 AI制药是指将NLP、深度神经网络,生成模型等AI技...
世界杯在即:国产彩电的出海故事... 球还没看,彩电先破防了 撰文/ 孟会缘 编辑/ 陈邓新 排版/ Annalee 国产彩电品牌,正深陷...
医疗健康领域投融资日报(5月1... 据亿欧数据统计,昨日(2026年5月15日)共披露16起投融资事件,涉及15家国内企业,1家国外企业...
深圳中创商业咨询携手海旗控股集... 海旗控股集团旗下宁波锦曼程新材料有限公司,自创立以来始终深耕高分子材料领域,秉承推动行业创新与可持续...
原创 关... 前言 大家好,我是老金。 国际地缘博弈的棋盘上,从来没有绝对的秘密,只有刻意或无意的战略试探,近期...
原创 欧... 今天来给大家聊一下最近的欧盟,自从特朗普说要来访华,欧洲的动作有点让人看不懂。从四月中旬到五月初,欧...
心系投资者 携手共行动 ——人... 为落实监管工作要求,切实维护金融消费者合法权益,在 “5・15 全国投资者保护宣传日” 当天,人保寿...
黄仁勋打卡蜜雪冰城 同款产品销... 财联社5月16日讯(记者 沈娇娇)5月15日上午,英伟达CEO黄仁勋现身北京南锣鼓巷,并且进入一家蜜...