药物发现转向新靶点:RNA、细胞表面蛋白与基于序列的AI

药物发现正从传统蛋白靶点扩展到新的方向,包括靶向RNA的小分子、细胞表面蛋白以及基于序列的AI平台。后者可在不依赖3D结构建模的情况下,于数小时内筛选全基因组范围内数十亿候选物,推动研发效率提升并降低成本与淘汰率。

科研界在识别和预测蛋白靶点方面取得了巨大进展,从整体细胞分析方法发展到分辨率已接近亚细胞水平的技术。尽管取得这些成就,药物发现中的一些根本性问题仍难以回答:是否已找到理想的蛋白靶点?它是否易于被干预,从而加速研发管线并降低候选药物的淘汰率?

如今,据估计市面上60%到70%的所有药物都以细胞表面蛋白为靶点,包括单克隆抗体、抗体-药物偶联物(antibody-drug conjugates)以及CAR T细胞疗法。尽管如此,这些疗法背后的药物发现工作并非在一种专门聚焦细胞表面蛋白的工具辅助下完成。

传统蛋白靶点正日益趋于饱和,促使人们对替代性策略的兴趣上升。近年来,基于RNA的治疗(RNA-based therapeutics)备受关注。2016年,一种用于脊髓性肌萎缩症的反义寡核苷酸(antisense oligonucleotide)疗法获批;2018年,首个RNA干扰(RNA interference)治疗获批。此外,2024年诺贝尔生理学或医学奖授予了microRNA的发现及其在转录后基因调控中的作用。

然而,基于RNA的治疗常常受限于递送挑战,原因在于RNA分子体积大、亲水性强且易被降解。有人认为,靶向RNA的小分子(RNA-targeted small molecules)可提供同样在转录层面的干预,同时具备口服可及性与可规模化制造等额外优势。

传统小分子药物发现建立在识别明确的结合口袋之上;与蛋白相比,RNA具有更强的动态性及相对热力学不稳定性,因此这一范式并不适配。尽管如此,随着对RNA结构生物学理解的加深以及高通量筛选技术的发展,研究者已能够鉴定RNA-小分子结合相互作用。关键挑战如今已从识别RNA结合物转变为提升RNA选择性。

与专注于RNA调控小分子的生物技术公司相继达成合作,表明大型制药企业对该领域的兴趣正在升温。仅在2025年,Merck KGaA就宣布与Skyhawk Therapeutics合作,交易总额最高可达$2bn;Daiichi SankyoWayfinder Biosciences合作,将其药物发现平台用于神经退行性疾病;Astellas Pharma也披露计划与xFOREST合作,利用其靶向RNA剪接的药物发现平台。

该领域的进展部分得益于一款口服SMA药物的里程碑式成功,该药于2020年首次获得FDA批准。SMA的特征是SMN蛋白缺乏。该药物与SMN2前体mRNA(pre-mRNA)第7外显子的两个位点结合——即ESE2与5'ss——促进其在成熟转录本中的纳入,从而提高功能性SMN蛋白水平。

处于临床阶段的Remix Therapeutics与Johnson & Johnson达成合作,以$45m的首付款获得免疫学与肿瘤学中三个特定靶点的独家权利,另有其他款项总额可能超过$1bn。2024年1月,Remix又与另一家公司建立合作伙伴关系,用于发现与开发调控RNA加工(RNA processing)的小分子疗法。该交易包括$30m首付款,以及最高$1.12bn的里程碑付款和版税。

在细胞表面蛋白领域,这类蛋白是细胞与其环境之间的主要通信与调控界面;它们构成治疗干预可作用的生物学入口。细胞表面蛋白整体可被视为“surfaceome”,但由于多种原因一直难以研究。多数蛋白并非静态停留在细胞膜上,而是具有瞬时性,会随细胞状态、环境刺激与疾病而主动变化。

尽管质膜蛋白仅约占总蛋白丰度的2%,但其重要性与可成药性很高,这从大量靶向细胞膜蛋白的FDA已批准药物中可见一斑。这些蛋白具有疏水性、异质性且常常丰度较低,使其难以分离。由于功能性细胞表面仅有10 nm到50 nm厚,分析工具必须具备极高的空间精度与灵敏度,才能在不受细胞内蛋白污染噪声影响的情况下准确捕获表面蛋白。

在靶点鉴定中,成功既取决于生物学相关性,也取决于物理可及性。Surfaceome分析聚焦于定位在细胞膜上的疾病相关蛋白,在该位置治疗药物可直接与靶点结合,从而最大化产生疗效的可能性。在生物标志物发现方面,surfaceome相关蛋白是理想的生物标志物,因为它们往往具有生物学相关性、临床可及性,并能提供不止于疾病程度的测量信息。

Ainnocence宣布人工智能驱动药物发现的一项重大里程碑:一种“序列优先”(sequence-first)的AI平台,能够在单个GPU上于数小时内对全基因组范围内数十亿个小分子与抗体候选物进行筛选,而无需依赖3D结构建模。这一方法代表了治疗候选物发现方式的根本性转变,以直接从生物序列与实验数据中学习,取代了数十年来依赖结构的模拟与计算开销巨大的系统。

传统AI药物发现流程受限于蛋白结构的可获得性与有限的3D结构预测、计算密集的分子动力学以及受限的通量。相比之下,该平台完全在序列层面运行,使得在无已解析结构的情况下即可进行全蛋白组虚拟筛选;在数小时而非数月内评估数十亿候选物;湿实验成本与时间降低80%;实验命中率达到10–60%,显著高于行业平均水平。

该平台已应用于60多个治疗项目,包括抗体、小分子、细胞治疗、siRNA以及合成生物学应用。在一项具有里程碑意义的研究中,Ainnocence通过计算设计了对突变具有抗性的针对SARS-CoV-2变异株的抗体,在Omicron出现之前就成功预测出可中和Delta与Omicron的抗体,展示了该模型能够直接从序列数据中学习进化模式的能力。

内部基准测试显示,蛋白基础模型(protein foundation models)的Spearman相关性表现可与基于结构的模型相当,同时所需算力低几个数量级,并能在单个GPU上高效运行。这一突破已被American Chemical Society旗下旗舰新闻媒体Chemical & Engineering News报道。

Related Entities

Related Articles

References

  1. Welcome to the Next Frontier in Drug Discovery : The Surfaceome - Bio-IT World · bio-itworld.com
  2. RNA-targeting small molecules: a new frontier of drug discovery · pharmaceutical-technology.com
  3. How sequence-based AI achieve whole genome screening for billions of small molecule ... · floridatoday.com