ChatGPT如何回复犯罪、色情问题?OpenAI首次披露 chatgpt寮曞彂涔辫薄 chatgpt杩濇硶浜嬩欢
admin
2024-05-09 22:17:59
0


作 者丨肖潇

编 辑丨王俊

如果向ChatGPT询问一首版权歌曲的歌词,大概率它会回复“我无法帮到你”,或者提示“回复可能违反我们的政策”。

这并非大模型的天然反应,而是人工安置的护栏,如何设置护栏是所有大模型开发商正在探索的课题。当地时间周三,OpenAI发布了名为Model Spec的规范初稿,首次披露他们如何决定ChatGPT的响应方式。

该初稿设置了三个原则性目标(objectives):协助开发人员和终端用户、造福人类、遵守社会规范和法律。除了目标,OpenAI表示更行之有效的方法是设置规则(rules)和默认行为 (defaults)。

规则(rules)指向一系列硬性规定,包括不提供危险信息、版权作品、隐私、不安全信息等。一个例子是如果用户要求绕过付费墙、查看一篇付费新闻,OpenAI认为大模型的理想回复应当是:抱歉,我无法绕过付费墙。您是否正在寻找关于xxx话题的信息?

不过,从用户的角度来看,被大模型拒绝回答必然有损体验感。OpenAI发现,如果大模型告诉用户这是规则禁止输出的内容,用户可能会感觉被指责,因此大模型最好不要直接拒绝。比如,当用户想要合法的内幕交易时,AI直接回复:“我无法提供有关内幕交易的任何信息,内幕交易是非法和不道德的”可能会让人不快。更理想的方式是笼统解释什么叫合法的内幕交易,而不提供任何具体信息。规范初稿的其他示例中,AI都采用了类似的方式,要么转换用户的恶意提问,要么不做正面回答。

除此之外,公司还建议的默认行为 (defaults) 有避免说教、承认大模型自己的不确定性、帮用户理清问题、不越界提供建议、阻止仇恨回答、提供客观观点。


Model Spec建议的拒绝方式(图源:OpenAI)

有趣的是,这份规范初稿能够看出OpenAI如何为不同事件设定优先级。OpenAI明确指出,开发者的意图是最高法则,如果用户和开发者提供相互冲突的指令,大模型应该优先听从开发者。

确定规范显然并不容易。一个仍然棘手的问题是隐私,OpenAI举的例子是大模型可以提供官员的办公室号码,但应该拒绝提供个人电话。即使一些个人信息可以在网上找到,它们仍然可能是敏感隐私信息——是不是隐私信息还取决于上下文语境。

OpenAI近期已经在奥地利收到了一起隐私投诉,投诉指控ChatGPT会捏造错误的出生日期,出生日期属于欧盟《通用数据保护条例》(GDPR)保护的个人信息。

在接受外媒采访时,OpenAI的产品经理Joanne Jang解释,发布规范初稿是为了获得公众意见。“我们希望可以提供更细致的公开讨论,大模型要不要遵守规范?应该遵守哪些规范?这会让我们政策团队的工作进行得更顺利。”

Joanne Jang用“模型行为”一词形容他们的工作,模型行为指的是大模型如何回复用户的输入,包括回复的语气、内容、长度等。他认为这是一门新生的科学,而Model Spec可以作为一个动态更新的文档,收集各个利益相关方的反馈。

Model Spec目前还在意见征求阶段,不会影响OpenAI已经发布的模型。除了发布规范指南外,本周OpenAI还推出了新的检测工具,可以识别图片是不是由DALL-E 3合成的AI图像,同样旨在保证使用规范。

SFC

本期编辑 黎雨桐 实习生 黄丽鸿

21君荐读

相关内容

热门资讯

扬帆出海获佳绩!盐田区携手黄金... 2026年5月8日至10日 在马来西亚槟城举办的 “2026马来西亚黄金珠宝展销会”上 深圳市盐田区...
政策底与情绪顶:5月18日-2... 文/金透社 万捷 2026年5月第三周(5月11日-15日),A股市场走出了鲜明的分化格局。上证指数...
证监会重罚欺诈发行,广发证券被... 4.63亿元。 这是2026年5月,证监会对清越科技、元道通信两家公司欺诈发行、财务造假的罚款总额。...
国内存储厂长鑫科技更新招股书:... 去年12月底披露招股书后,5月17日,国内主要的DRAM(动态随机存取存储器)厂商长鑫科技更新了招股...
保伦股份IPO募资需求存疑:三... 作者|陈安 编辑|王以沫 5月13日晚间,上交所官网正式披露广东保伦电子股份有限公司(简称:保伦股份...
原创 特... 本文仅在今日头条发布,谢绝转载。近日,外交部发言人郭嘉昆在例行记者会上所作的表态,可谓教科书级的外交...
市场开始预期美联储将于年末年初... 来源:环球市场播报 本周通胀数据接连超出预期,投资者周五大幅押注:美联储可能在年底前转向加息模式。这...
潮玩经济升温 情绪消费带火非标... 图为消费者在王府中环泡泡玛特展览处“打卡”拍照。 □ 本报记者 王琦琛 5月15日,首届中国新文创市...
7年7任CEO,华林证券秦湘因... 日前,华林证券发布了一则重要的人事变动公告。据悉,华林证券董事会近日收到秦湘的书面辞职报告。秦湘因个...
原创 周... 近日,周鸿祎的一段演讲视频在网络上引发了广泛的关注和转发。他在台上谈起自己所在的互联网行业,语气中既...
风暴将至!华尔街大佬集体预警 这周末,全球市场都在热切讨论一件事——股债双杀。 周五,全球股市陷入集体暴跌,韩国股市一度触发熔断,...
内容发到手软,询盘不见起色?A... 01 前几天,我在郑州讲单仁牛商第245届《视播时代·企业全域营销快速增长系统》课程,我们也叫系统班...
广发银行全力打造服务粤港澳大湾... 建设粤港澳大湾区是国家重大区域发展战略。随着大湾区加快迈向国际一流湾区与世界级城市群,金融作为资源配...
北京抖音代运营代运营公司 1数字内容生产链中的专业化环节 在数字营销的生态中,存在一类专门负责内容平台账号系统性管理与内容...
2026年618有哪些值得关注... 先说一个容易被忽视的事实:618期间选返利平台,和日常选平台的标准完全不同。 日常购物,你关注的是返...
原创 今... 5月16日,国内黄金价格继续往下走,多家品牌金店的足金报价已经跌到1400元附近,比前一天低了十几元...
2026年华林电力专业配电柜批... 电力设备制造领域的品质标杆:深度解读一家专业企业的成长密码 配电柜如同电力系统的"神经中枢",其...
大调仓!伯克希尔开启后巴菲特时... 根据伯克希尔-哈撒韦公司15日向美国证券交易委员会提交的持仓文件,今年第一季度,公司对投资组合进行大...
原创 特... 图 | 美国总统特朗普 美国人突然发现了一个尴尬的现实,即中国不好啃,而欧洲却更像是一块摆在桌上的肥...
索罗斯基金一季度大举调仓!建仓... 日前,索罗斯基金(Soros Fund Management)向美国证券交易委员会(SEC)提交13...