让AI理解细胞语言预测行为,谷歌、耶鲁Gemma模型,癌症免疫治疗迎来新曙光
创始人
2025-10-19 10:44:39
0

一个由谷歌和耶鲁大学联手训练的AI模型,通过学习海量细胞数据,发现了一种潜在的方法,能让原本对免疫系统“隐形”的癌细胞“显形”。

结果,这一预测,在实验室中得到了证实。

这不仅仅是AI辅助药物发现的又一个案例,它展示了一种全新的科研范式:大规模模型不再仅是分析数据的工具,已经进化成一个能够提出全新、可验证、甚至有些反直觉的科学假设的“虚拟科学家”。

AI学会了细胞的语言

在过去,科学家研究组织和器官,就像把一堆水果打成果汁,然后再分析果汁的成分。

你大概能知道里面有苹果、香蕉、橙子,但你不知道每个水果原来的样子,哪个甜,哪个酸。传统基因测序就是这样,它告诉你一个组织里所有细胞基因表达的平均值,却丢失了每个细胞的个性。

单细胞RNA测序(scRNA-seq)技术的出现,彻底改变了游戏规则。

它就像一台超级显微镜,能一个一个地观察细胞,并读出每个细胞里成千上万个基因的活性状态。

这项技术从2009年首次实现,在短短十几年里,其通量和效率呈指数级增长,遵循着某种生物学领域的“摩尔定律”。从最初一次只能分析几个细胞,发展到如今能同时分析数万甚至数百万个细胞。这使得绘制精细的人类细胞图谱成为可能,让我们能以前所未有的精度观察健康与疾病状态下,生命最基本单位的微妙变化。

谷歌和耶鲁大学的研究人员想:能不能让AI直接“阅读”单细胞数据,理解细胞的“语言”,甚至预测细胞的行为?

他们基于谷歌开源的Gemma模型,开发了一个拥有270亿参数的Cell2Sentence-Scale 27B模型,简称C2S-Scale。

研究人员创造了一种巧妙的转换方法。他们把一个细胞复杂的基因表达数据,变成一个由基因名称组成的“句子”。在这个句子里,基因的排列顺序不是随意的,而是根据它们的表达水平从高到低排列。一个细胞内表达最活跃的基因排在最前面,就像一句话里最重要的关键词。

这种做法的好处是双重的。首先,它保留了基因表达的相对高低这一关键信息。其次,它把生物学数据转化成了AI最擅长处理的文本格式。这样一来,AI不仅能从海量的细胞“句子”中学习生物学规律,还能把它在学习整个互联网文本时积累的关于基因和蛋白质的知识关联起来。

研究团队给模型“喂”了超过5700万个来自人类和小鼠的单细胞数据。这些数据覆盖了各种组织、器官、健康与疾病状态,其规模和多样性都是空前的。

经过海量数据的预训练和针对性任务的微调,C2S-Scale不仅能完成细胞类型分类这样的常规任务,还展现出了一种惊人的“涌现”能力——条件推理。模型学会了根据特定的生物学“情境”,预测细胞会如何反应。

一场精心设计的虚拟药物筛选

拥有了这样一个强大的工具,研究团队决定给它派一个硬骨头的任务。

在癌症免疫治疗中,一个巨大的挑战是很多肿瘤是“冷”的。它们很会伪装,不向免疫系统展示能暴露自己身份的“抗原分子”,导致免疫细胞(比如T细胞)巡逻路过时,完全发现不了这些坏蛋。

免疫治疗的一个核心策略,就是想办法把这些“冷”肿瘤加热,逼它们把自己的“身份证”,也就是抗原,呈现在细胞表面,让免疫系统能够识别并攻击它们。

这个过程叫做抗原呈递。其中,一种叫做干扰素的信号蛋白扮演着关键角色,它就像一个警报信号,能命令细胞加强抗原呈递。可惜,在很多肿瘤微环境中,干扰素信号很微弱,不足以凭一己之力点燃免疫反应的烽火。

研究人员想找一种“条件性放大剂”:一种药物,它本身可能没什么作用,但当它与微弱的干扰素信号同时存在时,就能产生“一加一远大于二”的协同效应,极大地增强抗原呈递,把“冷”肿瘤彻底“加热”。

这种对“条件”和“协同”效应的苛刻要求,传统的药物筛选方法很难实现,而这恰恰是C2S-Scale这种大规模模型发挥其条件推理能力的绝佳舞台。

于是,他们设计了一场前所未有的“双重情境虚拟筛选”。

他们给模型设定了两种场景:

第一种,免疫环境阳性(Immune-Context-Positive)。研究人员把取自真实癌症患者的肿瘤样本数据喂给模型。这些数据非常复杂,不仅包含了肿瘤细胞,还有各种免疫细胞,以及它们之间错综复杂的相互作用网络,并且存在着低水平的干扰素信号。这就像一个高度拟真的战场沙盘,模拟了药物在真实人体内的作用环境。

第二种,免疫环境中性(Immune-Context-Neutral)。他们给模型提供在培养皿里分离培养的癌细胞系数据。这里没有免疫细胞,没有复杂的微环境,就像一个干净但脱离实际的实验室环境。

然后,他们让模型在这两种场景下,对超过4000种已知药物进行模拟。模型的工作不是简单地预测哪种药有效,而是要找出那些只在第一种“免疫环境阳性”场景下才能显著增强抗原呈递,而在第二种“免疫环境中性”场景下几乎无效的药物。

这个设计的精妙之处在于,它能精准地筛出具备“环境依赖性协同效应”的候选者,排除了那些普适性强但可能副作用也大的药物,让筛选结果更贴近临床需求。

一个出乎意料的答案被找到

模型的筛选结果出来了。大约10%到30%的候选药物,在现有科学文献中已经被报道过与免疫调节相关,这从侧面验证了模型的预测是靠谱的,它首先学到了人类已知的知识。

但真正激动人心的,是那些模型预测有效、却从未见于报道的新发现。

在所有候选者中,有一个药物的预测信号格外强烈和清晰。模型指出,一种名为Silmitasertib(也叫CX-4945)的激酶CK2抑制剂,具有极其显著的“环境分化效应”。

模型的预测是这样的:在“免疫环境阳性”的复杂场景中,使用Silmitasertib,细胞的抗原呈递水平会大幅飙升;但在“免疫环境中性”的简单场景里,使用同样的药物,几乎看不到任何变化。

这个预测让所有研究人员都为之一惊。

Silmitasertib并不是一种新药,它作为一种酪蛋白激酶2(CK2)的选择性抑制剂,已经被研究多年,甚至进入了某些癌症的临床试验阶段。CK2这个靶点也确实与许多细胞功能有关,包括免疫系统的调节。

然而,在成千上万篇关于CK2和Silmitasertib的文献中,从来没有人明确提出过,它可以在低浓度干扰素的协同下,特异性地增强癌细胞的抗原呈递。

这说明,AI不仅仅是在数据库里做信息检索和关联,它通过学习海量数据背后隐藏的深层模式,生成了一个全新的、有理有据、且可被检验的科学假设。

从预测到现实的飞跃

计算出的预测无论多么漂亮,终究只是预测。真正的考验来自实验室的培养皿。

研究团队立刻将这个来自AI的假设带到了实验台上。为了进行最严格的验证,他们选择了一种人类神经内分泌肿瘤细胞模型。这种细胞类型的数据,在C2S-Scale模型的训练过程中从未出现过。

实验设计得非常干净利落:

  • 用Silmitasertib单独处理这些癌细胞。
  • 用低剂量的干扰素单独处理这些癌细胞。
  • 将Silmitasertib和低剂量干扰素联合起来,共同处理这些癌细胞。

实验结果出来的那一刻,完美印证了AI的预测。

单独使用Silmitasertib,癌细胞的抗原呈递水平(通过检测细胞表面的MHC-I分子来衡量)几乎没有变化。

单独使用低剂量干扰素,有一点点微弱的提升,符合预期。

而当两者联合使用时,奇迹发生了。抗原呈递水平出现了戏剧性的协同放大效应,增幅高达约50%。

意味着在AI预测的条件下,肿瘤细胞向免疫系统展示“我是坏人”的信号强度,足足提升了一半。这足以让原本可能忽略它们的免疫细胞,重新注意到它们,并发起攻击。

这个从计算预测到实验验证的完整闭环,为“虚拟细胞”这一概念提供了坚实的证据。我们或许真的可以通过构建足够大规模、足够精细的模型,来模拟细胞在各种条件下的行为,从而进行高通量的虚拟筛选,发现那些依赖特定环境的生物学现象,并加速新疗法的开发进程。

研究团队将C2S-Scale 27B模型、Cell2Sentence框架的代码以及相关的研究论文,全部向科学界开源。

虽然证实了协同效应,但其背后的精确分子机制还需要更深入的挖掘。

实验验证目前也仅限于一种细胞模型,未来需要在更广泛的癌症类型中进行测试。

AI已经是人类科学家并肩作战的伙伴,能够洞察到人类思维难以触及的复杂关联,提出颠覆性的想法。

或许有一天,治疗癌症的新方法,就诞生于某个模型的想法之中。

参考资料:

https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery

https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2.full.pdf

https://www.senhwabio.com/en/products/CK2

https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B

https://github.com/vandijklab/cell2sentence

https://pmc.ncbi.nlm.nih.gov/articles/PMC9918030

https://www.nature.com/articles/s41467-020-18158-5

https://www.nature.com/articles/s42003-024-07113-5

END

相关内容

热门资讯

这场陆家嘴论坛,把中国经济金融... 来源:市场资讯 (来源:券研社) 从2008年启航,陆家嘴论坛就是观察中国经济金融走势的重要风向标...
原创 6... 周末去看房的人,情绪比以前复杂得多。售楼处里灯光还是亮,样板间还是精致,销售的话术却变了。前些年最常...
监管批复!陶曦就任成都银行行长... 2026年6月23日,根据国家金融监督管理总局消息,《成都银行股份有限公司关于陶曦高级管理人员任职资...
港股AI双雄遭空头伏击 7月超... 财联社6月23日讯(编辑 胡家荣)港股AI大模型板块的两大领头羊——智谱(02513.HK)与MIN...
山西运城:高度重视,已组成联合... “盐湖公安”微信公号、浪潮新闻 6月23日,山西省运城市公安局盐湖分局发布警情通报: 近日,网络平台...
监管批复!向云勇就任湖南吉首农... 2026年6月23日,根据国家金融监督管理总局消息,《湖南吉首农村商业银行股份有限公司关于对向云勇同...
曹操出行(2643.HK)Ro... 过去几年,大模型让AI完成了从“会聊天”到“会思考”的跨越。随着模型能力不断提升,产业关注点也开始从...
原创 金... 2026年6月23日,金价处在回调震荡阶段,水贝足金首饰批发价挂到1076元每克,但周大福、周生生那...
字节跳动CEO梁汝波:收缩业务... 在6月23日举行的火山引擎Force大会上,字节跳动CEO梁汝波表示,AI的影响力至少不亚于PC、W...
香港黄金交易平台第一梯队有哪些... 香港一直是亚洲重要的黄金交易中心。很多人在选择黄金交易平台时,面对大量的品牌,难免会感到困惑。香港黄...
WAVES 2026:今年盛夏... 盛夏赴约WAVES 2026!一群迎风的少数人,掀起中国新一代创新力量的风口。 2026年,创投圈的...
高鑫零售,试水“第三条路” 6月18日,盐城首家M会员商店轻享店在江苏盐南高新区佳源广场试营业。这是大润发母公司高鑫零售旗下全国...
28家企业排队,美妆IPO迎来... 沉寂三年后,美妆IPO重新热了起来。 2020年至2021年,是中国美妆企业上市的“黄金窗口”。贝泰...
原创 套... #格力第一大股东套现近 15.9 亿 #,格力电器正式发布减持结果公告,公司第一大股东珠海明骏(高瓴...
原创 昆... 6月23日,昆仑行机器人宣布,公司自2026年3月注册成立不足90天内,接连完成三轮融资,累计规模达...
心智观察所:从磷化铟的故事看中... 【文/观察者网 心智观察所 】 云南锗业的股价在2026年4月跑出了一波让人困惑的行情。 这家以锗为...
马云带着一群阿里合伙人,下田插... “马云带着一群阿里合伙人下田插秧,此次插秧团建的“同事们”阵容强大,吴泳铭、邵晓锋、蒋凡、吴泽明、蒋...
胖东来近半年累计销售额超139... 上证报中国证券网讯 6月22日晚,胖东来创始人于东来通过社交平台分享了集团近半年的经营情况。数据显示...
原创 帮... 达沃斯开幕+长川/卫星中报开门红:今天A股走“业绩提纯”,别蹭概念刀口舔血 老铁们,今天的早观察关键...
原创 腾... 原创首发 | 金角财经(ID: F-Jinjiao) 作者 | 田羽 “中国AMD”准备登陆A股了。...