Cleveland Clinic、IBM报告蛋白质模拟规模扩展至12,635个原子

Cleveland Clinic、RIKEN 和 IBM 利用量子计算机与超级计算机，完成了规模多达12,635个原子的蛋白质复合物模拟。这项工作在此前303原子 Trp-cage 模拟基础上进一步推进，展示了量子与经典计算协同在生物分子研究中的潜力。

科学家们在 Cleveland Clinic、RIKEN 和 IBM 利用 IBM 量子计算机以及全球两台最强大的超级计算机，对规模多达 12,635个原子 的蛋白质复合物进行了模拟。这是迄今已知使用量子硬件完成的、针对具有生物学意义分子的最大规模模拟，而这一成果部分得益于一种创新算法。该算法优化了量子计算机与经典计算机的协同工作方式，这一框架被称为 以量子为中心的超级计算（quantum-centric supercomputing）。

借助这一方法，研究团队捕捉到了两种具有生化相关性的蛋白质的行为，其规模约为6个月前同一方法最初所能实现规模的40倍。此外，在整个工作流程中的一个关键步骤上，模拟精度在同一时期内提高了多达210倍。

之所以决定探索量子计算机能否在蛋白质复合物模拟中发挥价值，是因为当前研究人员在研究候选药物如何与蛋白质结合时面临诸多挑战。这可能是生命科学研究中最困难、成本最高的问题之一，而且随着分子尺寸增大，当今现有的计算方法一直难以对其进行精确求解。

在这项工作中，经典计算机将蛋白质-配体复合物拆解为可计算的片段。IBM 的156量子比特 IBM Quantum Heron 处理器分别运行于美国 Cleveland Clinic 和日本 RIKEN 的 IBM 量子计算机中，并与 RIKEN 的 Fugaku 以及由东京大学和筑波大学运营的 Miyabi-G 协同计算这些片段的量子力学行为。该计算在模拟的某些部分需要动用多达94个量子比特，并执行近6,000次量子操作，随后再由经典计算机将结果重新组装，从而获得分子的完整表征。

根据发表于 arXiv 的论文，这一规模跃升得益于算法创新以及前沿计算基础设施的支持。这种被命名为 EWF-TrimSQD 的新型量子-经典混合算法显著降低了计算开销，并加快了在量子硬件上直接表征这些分子系统化学性质的能力。

这一突破性研究建立在此前针对名为 Trp-cage 的303原子基准分子的建模工作之上；Trp-cage 是已知首个由20个氨基酸组成、完整采用以量子为中心方法进行模拟的体系。在此前的演示中，Cleveland Clinic 与 IBM 的联合研究团队利用以量子为中心的超级计算工作流程以及 IBM Quantum Heron r2，对303原子迷你蛋白 Trp-cage 进行了建模。研究人员对其未折叠态和折叠态都进行了建模。

Trp-cage 工作流程依赖基于波函数的嵌入方法，将分子拆分为计算上可处理的片段，称为簇（clusters）。在任何给定蛋白质中，一些簇可以使用经典计算方法高效求解，而更大、且更接近分子核心的簇则适合由量子计算机求解。将这些结果重新拼接后，各个簇计算的结果便可导出该分子电子结构的完整解，从而描述电子的位置及其相互作用方式。

Cleveland Clinic、IBM报告蛋白质模拟规模扩展至12,635个原子

Related Entities

Related Articles

量子化学研究报告药物样分子模拟取得进展

混合量子-超级计算系统完成首个生物分子模拟全流程

Algorithmiq、Cleveland Clinic和IBM赢得200万美元Q4Bio奖

机器学习突破实现药物发现中精确量子化学计算

量子计算新突破：有望加速药物研发与材料研究

References