宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
创始人
2025-05-28 05:29:19
0

文章目录

  • 前言
  • 一、准确性提升
    • 1.创造力
    • 2.视觉输入
    • 3.更长的上下文
  • 二、相比于ChatGPT有哪些提升
    • 1.GPT-4 的高级推理能力超越了 ChatGPT
    • 2.GPT-4 在多种测试考试中均优于 ChatGPT。
  • 三、研究团队在GPT-4模型都做了哪些改善
    • 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
    • 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
    • 3.安全与对齐:
  • 四、和一些开发创新产品的组织合作
  • 五、其他
    • 详细研究报告
    • 基础设施:
    • 局限性
    • 可用性
  • 总结


前言

昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】
在这里插入图片描述


一、准确性提升

GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:

1.创造力

在这里插入图片描述

如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input

用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。

Output

美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。

从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

2.视觉输入

GPT-4还支持视觉输入
在这里插入图片描述
在这里插入图片描述
上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:

Output

有很多种方法可以用这些食材制作美食!以下是一些可能的选择:

  • 煎饼或华夫饼
  • 可丽饼
  • 法式吐司
  • 煎蛋卷或意式烘蛋
  • 蛋奶酥或布丁
  • 蛋糕或纸杯蛋糕
  • 松饼或面包
  • 饼干或饼干
    这只是其中的一些例子,但可能性是无穷无尽的!

这回复简直太赞了!

3.更长的上下文

在这里插入图片描述
GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

二、相比于ChatGPT有哪些提升

1.GPT-4 的高级推理能力超越了 ChatGPT

在这里插入图片描述
Input

安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?

ChatGPT Output

以下是他们的空闲时间列表:

  • 安德鲁:上午11点至下午3点
  • 乔安娜:中午12点至下午2点,下午3点半至5点
  • 汉娜:中午12点至12点半,下午4点至6点
    根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点

GPT-4 Output

安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半

2.GPT-4 在多种测试考试中均优于 ChatGPT。

在这里插入图片描述
在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。


三、研究团队在GPT-4模型都做了哪些改善

1.遵循 GPT、GPT-2 和 GPT-3 的研究路径

我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。

2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。

在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%

3.安全与对齐:

  • 1.通过人工反馈进行训练(人工+专家反馈)
    • 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
  • 2.从现实世界的使用中不断改进(现实世界反馈)
    • 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
    1. GPT-4 辅助的安全研究(自己使用)
    • GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。

四、和一些开发创新产品的组织合作

  • Duolingo:一种对话类应用
  • Be My Eyes:使用GPT-4提高视觉能力
  • Stripe:使用GPT-4简化用户体验并打击欺诈
  • Morgan Stanley:使用GPT-4来管理公司内部知识库
  • Khan Academy:在试点项目中探索GPT-4的潜力
  • Government of Iceland:使用GPT-4保护本土语言
  • Etc.

五、其他

详细研究报告

https://openai.com/research/gpt-4

基础设施:

GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。

局限性

GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。

可用性

我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。

总结

GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!

上一篇:qt - 图像

下一篇:shiro学习笔记

相关内容

热门资讯

黄金闪崩9%!白银跌27%?别... 伦敦金现一天跌9.45%,A股黄金概念股大面积跌停;白银更是单日暴跌26.77%。一夜之间,曾经高歌...
周末这两大重要消息,对2月A股... 刚过去的交易周(1月26日至30日),A股整体呈现放量震荡格局,日均成交额超3万亿元。在大资金持续净...
新任美联储主席提名人选,为什么... 新任美联储主席提名人选终于揭晓。 据新华社报道,美国总统特朗普30日提名美联储前理事凯文·沃什为下任...
上游观察・两会|“十五五”开新... 2月1日上午,2026重庆两会圆满落幕。 回望“十四五”,新重庆交出亮眼答卷——成为中西部地区首个经...
雷军确认一月锁单未交付小米YU... IT之家 2 月 1 日消息,小米今日公布小米 YU7 全新「7 年低息」方案,对于“一月锁单未交付...
项链小红书获客封神攻略!家装人... 做项链饰品的宝子是不是都有同款崩溃:拍100张精修图、写半天文案,笔记互动却个位数;投流花了钱,到店...
SpaceX申请部署100万颗... 大象新闻2026-02-01 10:39:51 据美国《个人电脑杂志》网站1月31日报道,马斯克旗下...
美股点金丨避险情绪升级,美股2... 美股本周尾盘走低,不过三大股指仍以亮眼表现收官1月。下周市场将迎来月度就业报告,外界对货币政策预期可...
肿瘤患者饮食“三不要三要”,吃... 一、饮食“三不要”,避开抗癌饮食坑 1. 不要轻信“饿死癌细胞”:癌细胞会优先抢夺身体营养,盲目节...
宜家在中国败给了谁? 作者 | 会写字的机器猫 来源|新消费智库 图片 | AI生成 新消费导读 上海宝山宜家商场,那个...
证监会拟扩大战略投资者类型并明... 记者1月30日从中国证监会获悉,为贯彻落实《关于推动中长期资金入市的指导意见》和《关于推动中长期资金...
突然大跌!加密货币市值一夜蒸发... 2月1日凌晨,比特币一度跌至75719美元/枚,跌至2025年4月以来的最低水平。截至发稿,比特币回...
刚刚,大跳水!超42万人爆仓!... 来源:券商中国 加密货币,遭遇抛售潮! 凯文·沃什被提名为下一任美联储主席所产生的后续效应,正持续波...
做好银行网点“加减法” 国家金融监督管理总局网站披露的信息显示,2025年共有约1.1万家银行业金融机构的线下网点获准退出,...
金价暴跌引热议,网友:商场门口... 来源:中国基金报 随着国际金价急速下跌,国内首饰金价也迎来大幅回调。 1月31日,老庙报1546元/...
内蒙古一银行员工将储户220万... 内蒙古一银行员工将储户220万元存款转走并挥霍,银行称员工已离岗不愿承担赔偿 1月31日,有媒体报...
老年医学科进修轶事|老年医学如... 和年苑,北京协和医院老年医学科公众号,传递老年医学的价值和声音 在这里,了解当代老年医学 Autum...
和讯投顾余兴栋:周五杀跌,下周... 周五大盘大幅度的杀跌又探底回升,收出一根长长的下影线,不少的朋友又在问我,那这根k线是不是就意味着调...
【数智周报】马化腾评豆包手机;... 【数智周报将整合本周最重要的企业级服务、云计算、大数据领域的前沿趋势、重磅政策及行研报告。】 观点马...