网传Ilya Sutskever的推荐清单火了,掌握当前AI 90% 网传Ilya Sutskever的推荐清单火了,掌握当前AI 90%
admin
2024-05-09 20:09:41
0

机器之心报道

编辑:小舟

随着生成式 AI 模型掀起新一轮 AI 浪潮,越来越多的行业迎来技术变革。许多行业从业者、基础科学研究者需要快速了解 AI 领域发展现状、掌握必要的基础知识。

如果有一份「机器学习精炼秘笈」,你认为应该涵盖哪些知识?

近日,一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。网友称「Ilya 认为掌握了这些内容,你就了解了当前(人工智能领域) 90% 的重要内容。」



推荐清单:https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE

从研究主题上看,Ilya Sutskever 重点关注 transformer 架构、循环神经网络(RNN)、长短期记忆网络(LSTM)、神经网络的复杂度等。



推荐清单部分截图。

例如,Ilya 推荐谷歌在 2017 年发表的经典论文《Attention Is All You Need》,这是 transformer 架构的问世之作。transformer 架构今天已经成为人工智能领域的主流基础架构,特别是它是生成式 AI 模型的核心架构。

Ilya 不仅推荐原论文,还推荐一篇由康奈尔大学副教授 Alexander Rush 等研究者在 2018 年撰写的博客文章 ——《The Annotated Transformer》。这篇文章以逐行实现的形式呈现了论文的注释版本,它重新排序梳理了原论文的内容,并删除了一些部分,最终展现的是一个完全可用的实现。2022 年 Austin Huang 等研究者又在其基础上编辑整理出一份采用 PyTorch 实现的更新版博客。



在 RNN 方面,Ilya 首先推荐阅读 AI 大牛 Andrej Karpathy2015 年撰写的一篇博客,强调「RNN 惊人的有效性」。



Ilya 还推荐了由纽约大学 Wojciech Zaremba(OpenAI创始团队成员)和 Ilya Sutskever 本人 2015 年发表的论文《Recurrent Neural Network Regularization》。当时,Ilya 还是谷歌大脑的研究科学家。



这篇论文为 RNN 提出了一种简单的正则化技术,阐述了如何正确地将 dropout 应用于 LSTM,大大减少了各种任务的过拟合,包括语言建模、语音识别、图像字幕生成、机器翻译等等。

此外,Ilya 还推荐了 DeepMind、伦敦大学学院 2018 年联合发表的论文《Relational recurrent neural networks》。



在 LSTM 方面,Ilya 推荐了 Anthropic 联合创始人、前 OpenAI 可解释性团队技术负责人 Christopher Olah 2015 年撰写的博客文章《Understanding LSTM Networks》,这篇文章全面细致地讲解了 LSTM 的基本知识,并阐明 RNN 取得的显著成果本质上是依靠 LSTM 实现的。



在「复杂度」方面,Ilya 重点推荐了《Kolmogorov Complexity and Algorithmic Randomness》一书中讲解「算法统计」的部分。柯尔莫哥洛夫复杂度为计算理论提供了一个用于探索问题固有复杂度的框架,可帮助研究人员更好地设计和评估 AI 模型。



在这份推荐清单中,我们还看到了一些著名 AI 学者的经典论文。例如,2012 年 ImageNet 图像识别大赛中图灵奖得主 Geoffrey Hinton 组的论文《ImageNet Classification with Deep Convolutional Neural Networks》,这篇论文提出了 AlexNet,引入了全新的深层结构和 dropout 方法,颠覆了图像识别领域,甚至被认为开启了深度学习革命。Ilya 也是这篇论文的三位作者之一。



还有 2014 年,DeepMind Alex Graves 等人提出的神经图灵机(NTM)。NTM 将神经网络的模糊模式匹配能力与可编程计算机的算法能力相结合,具有 LSTM 网络控制器的 NTM 可以从输入和输出示例中推断出简单的算法,例如复制,排序等。



此外,Ilya 还推荐了神经网络应用于基础科学(化学)的研究论文、扩展定律相关文章等等,并推荐了斯坦福大学计算机科学课程 CS231n:用于视觉识别的卷积神经网络。



感兴趣的读者可以查看原推荐清单,了解更多内容。

参考链接:https://twitter.com/keshavchan/status/1787861946173186062

相关内容

热门资讯

扬帆出海获佳绩!盐田区携手黄金... 2026年5月8日至10日 在马来西亚槟城举办的 “2026马来西亚黄金珠宝展销会”上 深圳市盐田区...
政策底与情绪顶:5月18日-2... 文/金透社 万捷 2026年5月第三周(5月11日-15日),A股市场走出了鲜明的分化格局。上证指数...
证监会重罚欺诈发行,广发证券被... 4.63亿元。 这是2026年5月,证监会对清越科技、元道通信两家公司欺诈发行、财务造假的罚款总额。...
国内存储厂长鑫科技更新招股书:... 去年12月底披露招股书后,5月17日,国内主要的DRAM(动态随机存取存储器)厂商长鑫科技更新了招股...
保伦股份IPO募资需求存疑:三... 作者|陈安 编辑|王以沫 5月13日晚间,上交所官网正式披露广东保伦电子股份有限公司(简称:保伦股份...
原创 特... 本文仅在今日头条发布,谢绝转载。近日,外交部发言人郭嘉昆在例行记者会上所作的表态,可谓教科书级的外交...
市场开始预期美联储将于年末年初... 来源:环球市场播报 本周通胀数据接连超出预期,投资者周五大幅押注:美联储可能在年底前转向加息模式。这...
潮玩经济升温 情绪消费带火非标... 图为消费者在王府中环泡泡玛特展览处“打卡”拍照。 □ 本报记者 王琦琛 5月15日,首届中国新文创市...
7年7任CEO,华林证券秦湘因... 日前,华林证券发布了一则重要的人事变动公告。据悉,华林证券董事会近日收到秦湘的书面辞职报告。秦湘因个...
原创 周... 近日,周鸿祎的一段演讲视频在网络上引发了广泛的关注和转发。他在台上谈起自己所在的互联网行业,语气中既...
风暴将至!华尔街大佬集体预警 这周末,全球市场都在热切讨论一件事——股债双杀。 周五,全球股市陷入集体暴跌,韩国股市一度触发熔断,...
内容发到手软,询盘不见起色?A... 01 前几天,我在郑州讲单仁牛商第245届《视播时代·企业全域营销快速增长系统》课程,我们也叫系统班...
广发银行全力打造服务粤港澳大湾... 建设粤港澳大湾区是国家重大区域发展战略。随着大湾区加快迈向国际一流湾区与世界级城市群,金融作为资源配...
北京抖音代运营代运营公司 1数字内容生产链中的专业化环节 在数字营销的生态中,存在一类专门负责内容平台账号系统性管理与内容...
2026年618有哪些值得关注... 先说一个容易被忽视的事实:618期间选返利平台,和日常选平台的标准完全不同。 日常购物,你关注的是返...
原创 今... 5月16日,国内黄金价格继续往下走,多家品牌金店的足金报价已经跌到1400元附近,比前一天低了十几元...
2026年华林电力专业配电柜批... 电力设备制造领域的品质标杆:深度解读一家专业企业的成长密码 配电柜如同电力系统的"神经中枢",其...
大调仓!伯克希尔开启后巴菲特时... 根据伯克希尔-哈撒韦公司15日向美国证券交易委员会提交的持仓文件,今年第一季度,公司对投资组合进行大...
原创 特... 图 | 美国总统特朗普 美国人突然发现了一个尴尬的现实,即中国不好啃,而欧洲却更像是一块摆在桌上的肥...
索罗斯基金一季度大举调仓!建仓... 日前,索罗斯基金(Soros Fund Management)向美国证券交易委员会(SEC)提交13...