宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
创始人
2025-05-28 05:29:19
0

文章目录

  • 前言
  • 一、准确性提升
    • 1.创造力
    • 2.视觉输入
    • 3.更长的上下文
  • 二、相比于ChatGPT有哪些提升
    • 1.GPT-4 的高级推理能力超越了 ChatGPT
    • 2.GPT-4 在多种测试考试中均优于 ChatGPT。
  • 三、研究团队在GPT-4模型都做了哪些改善
    • 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
    • 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
    • 3.安全与对齐:
  • 四、和一些开发创新产品的组织合作
  • 五、其他
    • 详细研究报告
    • 基础设施:
    • 局限性
    • 可用性
  • 总结


前言

昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】
在这里插入图片描述


一、准确性提升

GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:

1.创造力

在这里插入图片描述

如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input

用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。

Output

美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。

从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

2.视觉输入

GPT-4还支持视觉输入
在这里插入图片描述
在这里插入图片描述
上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:

Output

有很多种方法可以用这些食材制作美食!以下是一些可能的选择:

  • 煎饼或华夫饼
  • 可丽饼
  • 法式吐司
  • 煎蛋卷或意式烘蛋
  • 蛋奶酥或布丁
  • 蛋糕或纸杯蛋糕
  • 松饼或面包
  • 饼干或饼干
    这只是其中的一些例子,但可能性是无穷无尽的!

这回复简直太赞了!

3.更长的上下文

在这里插入图片描述
GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

二、相比于ChatGPT有哪些提升

1.GPT-4 的高级推理能力超越了 ChatGPT

在这里插入图片描述
Input

安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?

ChatGPT Output

以下是他们的空闲时间列表:

  • 安德鲁:上午11点至下午3点
  • 乔安娜:中午12点至下午2点,下午3点半至5点
  • 汉娜:中午12点至12点半,下午4点至6点
    根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点

GPT-4 Output

安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半

2.GPT-4 在多种测试考试中均优于 ChatGPT。

在这里插入图片描述
在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。


三、研究团队在GPT-4模型都做了哪些改善

1.遵循 GPT、GPT-2 和 GPT-3 的研究路径

我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。

2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。

在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%

3.安全与对齐:

  • 1.通过人工反馈进行训练(人工+专家反馈)
    • 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
  • 2.从现实世界的使用中不断改进(现实世界反馈)
    • 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
    1. GPT-4 辅助的安全研究(自己使用)
    • GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。

四、和一些开发创新产品的组织合作

  • Duolingo:一种对话类应用
  • Be My Eyes:使用GPT-4提高视觉能力
  • Stripe:使用GPT-4简化用户体验并打击欺诈
  • Morgan Stanley:使用GPT-4来管理公司内部知识库
  • Khan Academy:在试点项目中探索GPT-4的潜力
  • Government of Iceland:使用GPT-4保护本土语言
  • Etc.

五、其他

详细研究报告

https://openai.com/research/gpt-4

基础设施:

GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。

局限性

GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。

可用性

我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。

总结

GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!

上一篇:qt - 图像

下一篇:shiro学习笔记

相关内容

热门资讯

特斯拉 Robotaxi 开始... IT之家 7 月 30 日消息,特斯拉在奥斯汀运营的 Robotaxi 无人驾驶出租车又迎来了新的定...
人工智能冲进热门专业 Top1... 山东考生李响,近日收到了上海某二本院校人工智能 ( AI ) 专业录取通知书,兴奋劲还没过,便把信息...
沪市融资额超1万亿,击鼓传花还... 沪市融资余额突破1万亿元大关的消息刷屏了朋友圈,这个数字创下了近十年新高。表面上看,这是市场信心高涨...
华安基金人事变动:原招商基金总... 界面新闻记者 | 韩理 又有基金公司发生重大人事变动。 界面新闻了解到,华安基金党委书记、董事长朱...
原创 爱... 百元套餐承载不起体检期待? 作者 | 于婞 编辑丨高岩 来源 | 野马财经 当体检机构爱康国宾与十年...
张宏伟,已调离山东 据大众日报客户端7月30日报道显示,张宏伟因工作变动调离山东,辞去十二届山东省委委员职务。 张宏伟...
中信建投证券:董事会选举朱永为... 北京商报讯(记者 郝彦)7月30日,中信建投证券发布公告表示,于近日召开董事会,审议关于选举副董事长...
本地化策略持续生效,阿迪达斯大... 阿迪达斯近日发布2025年第二季度财报,显示公司全球营收达60亿欧元,同比增长12%;营业利润5.4...
星巴克中国区门店近八千家,超过... 新京报贝壳财经讯(记者阎侠)7月30日,星巴克发布2025财年第三季度财报,中国区第三季度营业收入、...
原创 别... 家人们,最近公积金贷款政策又有新变化啦!准备买房的朋友可得竖起耳朵听好了,这次贷款额度提高,首套房和...
今天A股,重磅利好来袭! 7月30日,A股三大指数涨跌不一。截至收盘,沪指涨0.17%,深成指跌0.77%,创业板指跌1.62...
好莱客818品牌日广州首发“消... 乐居财经 李奕和2025 年 7 月 30 日,「消费新主张 定制放心装」好莱客品牌日暨会员狂欢节发...
商务部部长王文涛会见美中贸易全... 王文涛部长会见美中贸易全国委员会董事会代表团 7月30日,商务部部长王文涛会见美中贸易全国委员会董...
芯迈半导体港股IPO:单一最大... 近期,芯迈半导体公布了招股说明书,准备冲刺港交所。 根据招股书,芯迈半导体是一家功率半导体公司,产品...
前瞻观点|世界500强全球投资... 当下,全球经济体系正经历着前所未有的混乱与震荡,宏观风险不断积聚,而中国经济也面临着需求收缩、供给冲...
疯抢43轮!溢价33.9%!刚... 就在刚刚,江宁两幅低密地块成功出让!其中,三山G50地块热度非常高,该地块是三山板块近10年来首次推...
57岁湖北前首富骤然身亡,家居... wumiancaijing.com / 几个月前才喊着“既没有退休打算,更没想过逃避责任”的汪林朋...
布米普特拉北京投资基金管理有限... 当地时间七月二十九日,美国液化天然气(LNG)出口领域的新锐巨头Venture Global宣布成功...
国泰A500ETF半年蒸发百亿... 2025年中,公募总规模突破34万亿元,同比增加3万亿,其中指数基金的规模净增了2.17万亿元,是主...
原创 美... 前言 近日,美国财政部长贝森特在瑞典斯德哥尔摩的美中贸易谈判中公开透露。 美国国会正在审议一项针对...