密苏里大学发布用于AI驱动药物开发的蛋白质模型基准PSBench

密苏里大学研究人员发布了PSBench,这是一个包含140万个经独立专家验证并带注释的蛋白质结构模型数据库。随着生物药发现转向数据驱动设计,该资源旨在提升人工智能对蛋白质模型质量的评估能力,并推动药物开发。

University of Missouri研究人员发布了PSBench——一个包含140万个带注释的蛋白质结构模型的数据库。这一新资源有望加速阿尔茨海默病和癌症等疾病的药物开发。这些模型已由独立专家验证,旨在帮助科学家构建更准确的人工智能系统,用于评估蛋白质结构模型的质量。AI领域的最新进展,包括AlphaFold等工具,已显著提升蛋白质结构预测能力,但尚无任何单一AI工具能够对所有类型的蛋白质都持续保持准确。

该数据库为科学家提供信息,以评估预测的蛋白质模型是否可信,而这对未来医学治疗的开发至关重要。蛋白质驱动着人体内的每一个生物过程,其三维形状决定了它们如何发挥功能。即便是微小的结构变化,也可能导致疾病。

PSBench资源的构建利用了**Critical Assessment of protein Structure Prediction (CASP)**中生成的内部资源和社区范围资源。CASP被广泛认为是评估蛋白质预测计算方法的国际黄金标准。这项每两年举办一次的竞赛旨在独立测试计算机模型,以预测蛋白质链如何折叠成功能所需的三维形状。

这些进展反映了生物药发现领域更广泛的转变:从缓慢的实验过程转向数据驱动的工程学科。深度学习的进展——从解读序列语法的蛋白质语言模型,到结构预测器和新一代生成模型——正使研究人员能够以前所未有的精度解码、预测并创造复杂的生物分子。通过从海量生物数据集中学习,这些系统能够发现连接序列、结构和功能的模式,推动该领域从依赖偶然发现转向以理性设计为主导的创新。

AI能够设计具有定制功能的新型蛋白质、抗体、肽和核酸,同时优化结合亲和力、稳定性和可制造性等属性。包括扩散模型和自回归架构在内的生成方法,使科学家能够探索广阔的分子设计空间,而这些空间通过传统筛选或定向进化难以触及。与此同时,机器学习也在通过预测性能、指导制剂开发和提出新型组分,改进脂质纳米颗粒、病毒载体和抗体偶联药物等递送策略。

早期由AI设计的生物药,包括肽类治疗药物、抗体和基于mRNA的候选产品,正进入临床评估。与此同时,AI引导的优化正在加速亲和力成熟和稳定性工程,减少对大规模实验筛选的需求,并缩短开发时间。

当前模型往往擅长预测分子结构,但难以捕捉生物系统的复杂性,导致计算机模拟(in silico)预测与体内(in vivo)结果之间仍存在差距。免疫原性、药代动力学和细胞环境仍然难以准确建模,而高质量、任务特异性数据集获取有限,以及难以在不产生权衡的情况下同时优化多种药物属性,也限制了进展。近期一篇综述的作者表示,计算与实验之间更紧密的整合,尤其是通过闭环、AI驱动的工作流程——在这一流程中,自动化实验持续生成数据以优化模型——可能有助于弥合预测与实际表现之间的差距。

Related Entities

Related Articles

References

  1. MU launches clinical trial search resource | Mid-Missouri News | komu.com · komu.com
  2. How AI is Reshaping Biologic Drug Discovery - The Medicine Maker · themedicinemaker.com
  3. Making AI-based scientific predictions more trustworthy - Show Me Mizzou · showme.missouri.edu