AI并没有学习!Nature子刊最新研究解码人工智能黑盒 ai人工智能前沿研究 ai人工智能最新研究发现
admin
2024-01-16 18:58:52
0


新智元报道

编辑:alan

【新智元导读】人工智能模型一直以「黑匣子」的形态让人们感到不安,AI到底从数据中学到了什么?又是如何作出推理?最新研究为你揭秘AI的内部原理

人工智能(AI)一直在迅速发展,但对人类来说,强大的模型却是个「黑匣子」。

我们不了解模型内部的运作原理,不清楚它得出结论的过程。

然而最近,波恩大学(University of Bonn)的化学信息学专家Jürgen Bajorath教授和他的团队取得了重大突破。

他们设计了一种技术,揭示了药物研究中使用的某些人工智能系统的运行机制。

他们的研究结果表明,这些人工智能模型主要依赖于回忆现有数据,而不是学习特定的化学相互作用,来预测药物的有效性。

——也就是说,AI预测纯靠拼凑记忆,机器学习实际上并没有学习!

他们的研究结果最近发表在《自然机器智能》(Nature Machine Intelligence)杂志上。


论文地址:https://www.nature.com/articles/s42256-023-00756-9

在医药领域,研究人员正在狂热地寻找有效的活性物质来对抗疾病——哪种药物分子最有效?

通常,这些有效的分子(化合物)会对接在蛋白质上,蛋白质作为触发特定生理作用链的酶或受体。

在特殊情况下,某些分子还负责阻断体内的不良反应,例如过度的炎症反应。

可能的化合物数量巨大,寻找有效的化合物就像大海捞针一样。

因此,研究人员首先使用AI模型来预测,哪些分子最能与各自的靶蛋白对接并牢固结合。然后在实验研究中,更详细地进一步筛选这些候选药物。


自人工智能发展以来,药物发现研究也越来越多地采用AI相关的技术。

比如图神经网络(GNN),适用于预测某种分子与靶蛋白结合的强度。

图由表示对象的节点和表示节点之间关系的边组成。在蛋白质与配体复合物的图表示中,图的边连接蛋白质或配体节点,表示物质的结构,或者蛋白质和配体之间的相互作用。

GNN模型使用从X射线结构中提取的蛋白质配体相互作用图,来预测配体亲和力。

Jürgen Bajorath教授表示,GNN模型对于我们来说就像一个黑匣子,我们无法得知它如何得出自己的预测。


Jürgen Bajorath教授任职于波恩大学LIMES研究所、波恩-亚琛国际信息技术中心(Bonn-Aachen International Center for Information Technology)和拉玛机器学习与人工智能研究所(Lamarr Institute for Machine Learning and Artificial Intelligence)。

人工智能如何工作?

来自波恩大学化学信息学的研究人员,与罗马Sapienza大学的同事一起,详细分析了图神经网络是否真的学习到了蛋白质与配体的相互作用。

研究人员使用他们专门开发的「EdgeSHAPer」方法分析了总共六种不同的GNN架构。

EdgeSHAPer程序可以判断GNN是否学习了化合物和蛋白质之间最重要的相互作用,或者是通过其他的方式来得出预测。

科学家们使用从蛋白质配体复合物结构中提取的图训练了六个GNN,——化合物的作用方式以及与靶蛋白的结合强度已知。

然后,在其他复合物上测试经过训练的GNN,并使用EdgeSHAPer分析GNN如何产生预测。

「如果GNN按照预期行事,它们需要学习化合物和靶蛋白之间的相互作用,并且通过优先考虑特定的相互作用来给出预测」。

然而,根据研究小组的分析,六个GNN基本上都没有做到这一点。大多数GNN只学会了一些蛋白质与药物的相互作用,主要集中在配体上。


上图展示了在6个GNN中的实验结果,色标条表示用EdgeSHAPer确定的每个预测的前25个边中蛋白质、配体和相互作用所占的平均比例。

我们可以看到,代表绿色的相互作用本该是模型需要学到的,然而在整个实验中所占的比例都不高,而代表配体的橙色条占了最大的比例。

为了预测分子与靶蛋白的结合强度,模型主要「记住」了它们在训练过程中遇到的化学相似分子及其结合数据,而不管靶蛋白如何。这些被记住的化学相似性基本上决定了预测。


这让人想起「聪明的汉斯效应」(Clever Hans effect),——就像那匹看起来会数数的马,实际上是根据同伴面部表情和手势的细微差别,来推断出预期的结果。

这或许意味着,GNN所谓的「学习能力」可能是站不住脚的,模型的预测在很大程度上被高估了,因为可以使用化学知识和更简单的方法进行同等质量的预测。

不过,研究中也发现了另外一个现象:当测试化合物的效力增加时,模型倾向于学习到更多的相互作用。

也许通过修改表征和训练技术,这些GNN还能朝着理想的方向进一步改进。不过,对于可以根据分子图学习物理量的假设,一般来说应该谨慎对待。

「人工智能不是黑魔法。」

参考资料:

https://scitechdaily.com/decoding-the-black-box-of-ai-scientists-uncover-unexpected-results/


相关内容

热门资讯

2026别盼房价崩盘了!楼市分... 家人们,2026年开年就有个房产大V的言论炸了锅!说什么“房价跌了不用慌,家比房子值钱”,劝大家别再...
深圳龙岗:筑牢寄递防毒线,赋能... 为应对寄递渠道涉毒风险,提升一线从业者主动防御能力,一场别开生面的“筑牢寄递防毒线”沉浸式禁毒培训,...
20万颗卫星引爆A股,泼天富贵... 上周末最大的新闻,那还是属于航天。 倒不是谁又发火箭了,而是:中国一口气申请了超20万颗卫星! 如果...
恶意退货、“买真退假” 网购乱... 网购是如今很多人买衣服的主要方式,很多平台上也都有“七天无理由退货”的规则,让消费者可以放心买、放心...
解码基金“擒牛术”:布局十倍股... 证券时报基金研究院 匡继雄 刚刚过去的2025年,主动权益基金赛道跑出“现象级”赢家:永赢基金任桀管...
国家发改委原副主任扶持公司上市... 由中央纪委国家监委宣传部与中央广播电视总台央视联合摄制的电视专题片《一步不停歇 半步不退让》,于1月...
A股头条:商业航天又迎利好!中... 资讯速递 1、中国对日稀土出口许可审查被暂停?外交部回应 外交部发言人毛宁1月12日主持例行记者会。...
盘前必读丨中概股爆发金龙指数大... 【财经日历】 美国2025年12月CPI 2026三亚.国际种业科学家大会暨国际种业科技博览会(1/...
豪威集团“A+H”上市总市值1... 来源:长江商报 长江商报消息 ●长江商报记者 沈右荣 “芯片富豪”虞仁荣斩获了第三个IPO。 1月...
马斯克炮轰苹果谷歌联手打磨Si... IT之家 1 月 13 日消息,埃隆・马斯克(Elon Musk)今天(1 月 13 日)在 X 平...
原创 卖... 我朋友前年在城市边缘的新区买了个32层高层,是时下最流行的设计,精装修,会所配套一应俱全,那时候他还...
黄金站上4600美元再创新高,... 1月12日亚洲早盘,COMEX黄金期货价格直线拉升,站上每盎司4600美元,时隔两周再度刷新历史新高...
顺灏股份:投资轨道辰光事项对公... 人民财讯1月12日电,顺灏股份(002565)1月12日发布股票交易严重异常波动的公告,公司关注到近...
治疗白癜风无秘密?关键在“耐心... 在白癜风的治疗过程中,不少患者急于看到效果,四处寻求所谓的“治疗秘密”或“捷径”。但从临床诊疗经验来...
突发!商业航天牛股,停牌核查 1月12日晚,*ST铖昌公告称,公司股票交易连续10个交易日内4次出现同向股票交易异常波动情形,属于...
原创 女... 在探讨女性情感经历的复杂性时,我们不得不提到一个经常被提及的话题——恋爱次数。这不仅是一个关于个人成...
原创 对... 少年时阅读历史时,我们常常为项羽的失败感到困惑。他这位勇敢直接的青年,怎么会败给刘邦那个看似不怎么样...
英伟达与礼来共投10亿美元 建... 财联社1月13日讯(编辑 牛占林)英伟达与美国制药巨头礼来当地时间周一宣布,双方将在未来五年内投入1...
2026年做什么行业赚钱有前景... 站在2026年这个时间节点上,很多人明显感觉到,钱变得“聪明”了,也变得更难赚了。 过去那种靠信息差...
10亿基金落地 背靠广州工控庞... 观点网 近日,广州工控图南创业投资基金顺利完成备案,正式进入实质性运营阶段。 该基金由工控科创集团发...