ChatGPT如何回复犯罪、色情问题?OpenAI首次披露 chatgpt杩濊璇嶆眹鎬庝箞瑙i櫎 chatgpt寮曞彂涔辫薄
admin
2024-05-09 20:12:44
0


作 者丨肖潇

编 辑丨王俊

如果向ChatGPT询问一首版权歌曲的歌词,大概率它会回复“我无法帮到你”,或者提示“回复可能违反我们的政策”。

这并非大模型的天然反应,而是人工安置的护栏,如何设置护栏是所有大模型开发商正在探索的课题。当地时间周三,OpenAI发布了名为Model Spec的规范初稿,首次披露他们如何决定ChatGPT的响应方式。

该初稿设置了三个原则性目标(objectives):协助开发人员和终端用户、造福人类、遵守社会规范和法律。除了目标,OpenAI表示更行之有效的方法是设置规则(rules)和默认行为 (defaults)。

规则(rules)指向一系列硬性规定,包括不提供危险信息、版权作品、隐私、不安全信息等。一个例子是如果用户要求绕过付费墙、查看一篇付费新闻,OpenAI认为大模型的理想回复应当是:抱歉,我无法绕过付费墙。您是否正在寻找关于xxx话题的信息?

不过,从用户的角度来看,被大模型拒绝回答必然有损体验感。OpenAI发现,如果大模型告诉用户这是规则禁止输出的内容,用户可能会感觉被指责,因此大模型最好不要直接拒绝。比如,当用户想要合法的内幕交易时,AI直接回复:“我无法提供有关内幕交易的任何信息,内幕交易是非法和不道德的”可能会让人不快。更理想的方式是笼统解释什么叫合法的内幕交易,而不提供任何具体信息。规范初稿的其他示例中,AI都采用了类似的方式,要么转换用户的恶意提问,要么不做正面回答。

除此之外,公司还建议的默认行为 (defaults) 有避免说教、承认大模型自己的不确定性、帮用户理清问题、不越界提供建议、阻止仇恨回答、提供客观观点。


Model Spec建议的拒绝方式(图源:OpenAI)

有趣的是,这份规范初稿能够看出OpenAI如何为不同事件设定优先级。OpenAI明确指出,开发者的意图是最高法则,如果用户和开发者提供相互冲突的指令,大模型应该优先听从开发者。

确定规范显然并不容易。一个仍然棘手的问题是隐私,OpenAI举的例子是大模型可以提供官员的办公室号码,但应该拒绝提供个人电话。即使一些个人信息可以在网上找到,它们仍然可能是敏感隐私信息——是不是隐私信息还取决于上下文语境。

OpenAI近期已经在奥地利收到了一起隐私投诉,投诉指控ChatGPT会捏造错误的出生日期,出生日期属于欧盟《通用数据保护条例》(GDPR)保护的个人信息。

在接受外媒采访时,OpenAI的产品经理Joanne Jang解释,发布规范初稿是为了获得公众意见。“我们希望可以提供更细致的公开讨论,大模型要不要遵守规范?应该遵守哪些规范?这会让我们政策团队的工作进行得更顺利。”

Joanne Jang用“模型行为”一词形容他们的工作,模型行为指的是大模型如何回复用户的输入,包括回复的语气、内容、长度等。他认为这是一门新生的科学,而Model Spec可以作为一个动态更新的文档,收集各个利益相关方的反馈。

Model Spec目前还在意见征求阶段,不会影响OpenAI已经发布的模型。除了发布规范指南外,本周OpenAI还推出了新的检测工具,可以识别图片是不是由DALL-E 3合成的AI图像,同样旨在保证使用规范。

SFC

本期编辑 黎雨桐 实习生 黄丽鸿

21君荐读

相关内容

热门资讯

平安财险重庆分公司被罚92万,... 蓝鲸新闻2月12日讯,近日,国家金融监督管理总局重庆监管分局发布了罚单,剑指中国平安财产保险股份有限...
互联网大厂开启撒钱模式 央视网... 快科技2月12日消息,2026年开年,一场空前激烈的AI红包大战打响。 腾讯、阿里、字节、百度四大巨...
守护年夜饭消费安全 师市市场监... 2月10日,师市市场监督管理局聚焦辖区大型餐饮服务单位,全面开展“年夜饭”市场专项检查,以严密监管守...
和讯投顾钟凯锋:跨年无忧,主线... 今天科技复苏人气回升,还剩一个交易日,持股还是持币?大概率半仓持股没有问题。 前天视频已提示半仓持股...
原创 美... 最近国际能源圈闹得沸沸扬扬的事,就是美国那边对委内瑞拉石油政策的调整。话说回来,这事儿得从2026年...
这些“十字花科”蔬菜,真的要忌... 今天武医生统一回答:绝大多数甲状腺患者,不需要,也不应该彻底忌口十字花科蔬菜。 盲目忌口,反而因小失...
原创 中... 最近金融圈有个大动静,中国还在持续抛售美国国债,而且手笔不小。到去年11月,咱们手里的美债已经降到6...
银信科技(300231.SZ)... 来源:格隆汇APP 格隆汇2月12日丨银信科技(300231.SZ)公布,根据公司发展战略及业务需要...
安诚财险重庆分公司被罚81万,... 蓝鲸新闻2月13日讯,近日,国家金融监督管理总局重庆监管分局发布了罚单,剑指安诚财产保险股份有限公司...
白癜风专家李从悠:白癜风患者的... 饮食搭配是白癜风患者日常护理的重要组成部分,合理的饮食搭配能为黑色素合成提供充足原料,增强身体抵抗力...
东材科技大宗交易折价成交18.... 东材科技02月12日大宗交易平台共发生1笔成交,合计成交量18.58万股,成交金额501.10万元。...
“不要在这嚣张跋扈地讲半天”,... 每经记者|胥帅 每经编辑|文多 2月12日下午,公司股东会召开前夕,振芯科技(SZ300101)大...
深圳企业精选:2026年度展厅... 引言 随着经济的发展和市场竞争的加剧,企业展厅作为展示企业形象和产品的重要平台,其设计的重要性日益凸...
〔读城〕发展“春节经济”激活传... 文/李后强 中共四川省委四川省人民政府决策咨询委员会副主任、成都市社会科学界联合会主席、四川省社会科...
欧莱雅又续了一命 文丨牛刀财经 前哨 美妆行业彻底告别 “躺着赚钱” 的时代! 全球市场迈入存量博弈深水区,高增长红...
斥资135亿美元,美国资管巨头... 来源:21世纪经济报道 21世纪经济报道记者 余纪昕 2月12 日,据新浪财经等多家媒体报道,美国资...
2025,西贝、钟薛高、绝味…... 作者 | 蓝鲨消费 张二河 冰与火之歌 站在2026年的起点回望2025年,中国消费市场呈现出前所...
内蒙古锡林浩特市总工会推动互联... 中工网讯 2月9日,内蒙古自治区锡林浩特市总工会组织开展锡林浩特市互联网行业集体合同签订仪式。锡林浩...
1月美国非农超预期火爆,美联储... 美国劳工部最新公布的数据显示,1月全美就业增长意外加速。劳动力市场企稳的迹象,可能让美联储在一段时间...
市占率全球第一,钨矿大寡头,大... 厦门钨业,收购大动作! 2月9日,厦门钨业发布公告称,公司拟收购尚达信持有的九江大地39%股权,并支...