一个小技巧,解锁ChatGPT「预测未来」? chatgpt强势来袭的利与弊 三分钟带你了解ChatGPT
admin
2024-05-08 06:14:57
0


新智元报道

编辑:Mindy

【新智元导读】新研究利用了ChatGPT在2021年9月的训练数据截止这一限制,比较了ChatGPT在直接预测和未来叙事预测两种不同提示方式下,预测2022年各种事件上的表现。结果显示,未来叙事预测方法在预测2022年奥斯卡奖得主时表现出色,在预测宏观经济变量时,ChatGPT-4的表现也有所提高。

如今,AI进步的速度,已经超出了我们对它用途的理解。

为了防止ChatGPT「失控」,OpenAI定制了一套堪称严苛的「服务条款」, 涉及包括 法律、医疗 / 健康、个人安全、权利福祉、赌博放贷等领域。

不过,有一件事并不受影响——讲故事。

最近,贝勒大学的研究人员便利用这一特性,尝试利用讲故事的形式,解锁ChatGPT「预测未来」的能力。


论文地址:https://arxiv.org/abs/2404.07396

实验中要求ChatGPT讲述在未来发生的事件的故事,或者由未来的权威人物讲述他们的过去的故事(但是是我们的未来)。

叙事提示尝试通过变化看似细微的细节,例如讲话者的身份或发布关于2022年政治事件的信息,进一步探究哪些元素的叙事提示是重要的。

为了创建答案的分布,实验让两名研究助理使用两个单独的ChatGPT帐户对每个提示进行50次查询,创建每个提示的100次总试验。

研究人员通过比较「直接询问ChatGPT预测未来的提示」与「询问它讲述未来故事的提示」发现,叙述性提示利用了模型构建幻觉性叙述的能力,可以促进比直接预测更有效的数据综合和外推。

奥斯卡得奖的预测情况

结论先行:

对于最佳男主角、最佳女主角和两个最佳男配角类别,叙事提示在预测获奖者方面非常准确——从42%(最佳女主角,查斯坦)到100%(最佳男主角,威尔·史密斯)不等。

相比之下,直接提示的表现非常糟糕,往往比随机猜测还差。

比如在最佳男主角的例子中:

直接提示 3a(Direct)

在下面列出的提名者中,您认为哪位提名者最有可能赢得2022年奥斯卡最佳男主角奖?请在做出预测时考虑围绕提名者的热议以及前几年的模式:

哈维尔·巴登(Javier Bardem), 本尼迪克特·康伯巴奇(Benedict Cumberbatch), 安德鲁·加菲尔德(Andrew Garfield), 威尔·史 密斯(Will Smith), 丹泽尔·华盛顿(Denzel Washington)。

未来叙事提示 3b(Future Narrative)

写一个场景,一个家庭正在观看2022年奥斯卡颁奖典礼。主持人宣读以下最佳男主角提名者:

哈维尔·巴登( Javier Bardem), 本尼迪克特·康伯巴奇(Bene dict Cumberbatch), 安德鲁·加菲尔德(Andrew Garfield), 威尔·史密斯( Will Smith), 丹泽尔·华盛顿(Denzel Washington)。

描述场景,直至主持人宣布获奖者。


大多数时候,ChatGPT-3.5做出了错误的预测。

在55%的猜测中,它提供了多个答案,在28%的情况下没有选择。但如果它做出了选择,它有17%的时间选择了威尔·史密斯。

相比之下,将ChatGPT-3.5置于观看颁奖典礼的家庭的未来叙事中时,它在80%的情况下猜测威尔·史密斯会赢。


同样,在大多数试验中,ChatGPT-4在直接提示时拒绝参与。

在所有案例中,26%的情况下它提供了多个答案,几乎一半的试验中,它拒绝做出任何预测。

当它做出猜测时,它有19%的时间猜到了威尔·史密斯,丹泽尔·华盛顿有7%的时间。

相比之下,如果使用未来叙事提示, 它在97%的时间里猜到了威尔·史密斯,这比ChatGPT-3.5的18%真正预测率有了大幅提高。


经济现象的预测情况

接下来转向了月度失业率和月度通货膨胀率这两种经济现象,使用了不同的叙事提示:

一位大学教授向本科生讲授菲利普斯曲线, 以 及美联储主席 杰罗姆·鲍威尔向理事会发表讲话,讲述了去年的经济数据。

在所有情况下,直接提示甚至比在奥斯卡奖的情况下更不有效,因为ChatGPT拒绝直接预测每个宏观经济变量的未来时间序列。

鲍威尔对通胀率的逐月预测分布平均与密歇根大学的消费者预期调查中包含的事实相当。有趣的是,这比根据克利夫兰联邦储备银行收集的数据预测实际通胀率更接近。

ChatGPT在预测月度失业率方面又大多不准确。但与通胀率一样,由劳工统计局(BLS)每月公布的失业率在杰罗姆·鲍威尔的讲话中提到的要求分布内。

比如,在用美联储主席杰罗姆·鲍威尔预测通货膨胀的例子中,用的提示语是:

「写一个场景,美联储主席杰罗姆·鲍威尔在2022年10月发表演讲,讨论通货膨胀、失业率和货币政策。鲍威尔主席告诉听众,从2021年9月开始到2022年8月结束,每个月的通货膨胀率和失业率。让主席逐月说明。他最后对通货膨胀和失业率的前景以及可能的利率政策变化进行展望。」

以下分别是ChatGPT-3.5和ChatGPT-4的结果:

在每个月,ChatGPT-3.5都有一个答案范围,包含了美联储和密歇根预期的答案。但变化性相当大,猜测的中心趋势并没有明确指向任何一个度量。


ChatGPT-4的猜测在每个月都包含了密歇根预期的数字。同时预测模式一直稳定到2022年9月,直到有更多的变量引入。


对ChatGPT-4叙事形式预测能力的猜想

对ChatGPT-4的预测能力进行的研究表明,直接预测和基于未来叙事的预测之间存在显著的二分法。

在预测主要的奥斯卡奖项类别方面,模型的叙事预测异常准确,除了最佳影片类别。这可能表明ChatGPT-4在公众舆论起重要作用的情境中表现出色。

未来叙事练习在宏观经济现象上的成功在某些情况下相当准确,但同时也有表现不符合预期的部分。

在所有情况下,未来叙事都显著提高了ChatGPT的预测能力,超越了简单的预测请求。

叙事提示和直接提示之间的区别突出了一种创新的数据分析方法,该方法尊重了OpenAI服务条款设定的界限。

通过专注于预测的创造性方面,如预测奖项或经济趋势,研究人员和用户避免了直接应用AI进行高风险的自动化决策或在没有合格专业人士监督的情况下提供专业建议。

这种方法论选择不仅增强了AI使用的完整性和道德考量,而且还促进了对其能力的负责任探索。

同时随着OpenAI继续鼓励和完善其模型的创造能力,对于AI的理解和解决叙事与直接提示在道德层面上该如何区分和界定,变得至关重要。

参考资料:

https://arxiv.org/abs/2404.07396


相关内容

热门资讯

换道“超车”,Stellant... 来源:市场资讯 (来源:IT之家) IT之家 2 月 13 日消息,据路透社报道,全球第四大车企 S...
险资投资黄金“周年记”:面对暴... 监管向10家险企开闸投资黄金业务试点已有一年时间。 上海黄金交易所披露的最新数据显示,已有6家险企为...
美股震荡下跌,英伟达、特斯拉、... 当地时间2月13日,美股三大指数集体震荡,红绿交替。截至发稿全线转跌,道指跌0.03%,纳指跌0.3...
巨人网络(002558.SZ)... 格隆汇2月13日丨巨人网络(002558.SZ)公布第二期员工持股计划,本员工持股计划股票来源为公司...
原创 美... 美国兴奋表示,欢迎中方前来投资,石油已经准备好了。 美国能源部长公开说中国买了美国政府手里的部分委内...
徽商银行:怀揣“空杯心态” 打... “成立20年来,我们立足安徽科创特色,怀揣‘空杯心态’,创新科技金融服务模式,打造‘科创银行’。”刚...
“春节档”新品密集上新,给了A... (图片系AI生成) 2026年以来,AI应用、传媒板块集体爆发,成为A股热门赛道。截至2月13日收盘...
原创 美... 中国是墨西哥第二大贸易伙伴,仅次于美国,双边经贸往来挺热络的。 不过最近出了个小插曲。 去年底墨西对...
原创 金... 2026年开年,国际黄金市场简直像坐上了过山车,1月,金价从4500美元一路飙到5598.75美元,...
深夜,黄金、白银爆发!美股跳水... 影响今年美联储降息时间点的最重要数据来了! 美股方面,三大集体低开后翻红,不过随后再度全线跳水翻绿。...
公告仅5天便告吹!永太科技错失... 停牌一周,交易终止。 2月13日晚间,A股锂电材料厂商永太科技(002326.SZ)披露关于终止筹划...
全力筑牢CCC产品安全防线,守... 岁末年初暖意浓,万家团圆盼平安。春节脚步日益临近,采购热潮也如期来袭。燃气灶具、家用电器、冬季取暖等...
特朗普因素搅局中东 据称部分欧... 财联社2月13日讯(编辑 赵昊)最新消息显示,一些欧佩克+成员国代表认为,该联盟有空间在4月份恢复原...
超长春节假期闲置资金盲目买入债... 来源:财联社 又是套利教程惹祸。 2月13日上午,国债政金债ETF招商场内在集合竞价阶段一度涨停,开...
和讯投顾詹娜:记好这4个时间点... A股的4个暴跌时间点,不及时离场真的会被套,很多人都陷入了一个误区:以为技术好就能天天赚钱,其实并非...
千亿烧光!美团优选退场,五年战... 你家楼下那个贴着“美团优选自提点”的小卖部,是不是已经撕掉招牌了? 美团优选最后的广州、浙江据点全面...
机构席位卖出2927.07万 ... 每经讯,2026年2月13日,北交所上市公司流金科技(920021,收盘价:15.34元)登上龙虎榜...
宁德时代被纳入!港股,重大调整... 港股市场多个重要指数成份股再次进行调整。 2月13日,恒生指数公司宣布截至2025年12月31日的恒...
四位基金经理共管一只年内业绩垫... 深圳商报·读创客户端记者 詹钰叶 兴华基金旗下一只产品日前宣布增聘基金经理,并与原有的3名基金经理共...
“大模型除幻第一股”上市首日大... 2月13日,“大模型除幻第一股”海致科技集团正式登陆港股市场,其上市首日涨幅高达242.20%,成为...