机器学习突破实现药物发现中精确量子化学计算
研究人员开发了一种名为STRUCTURES25的机器学习方法,采用无轨道方法实现对大型类药物分子的精确量子化学计算。这一突破解决了计算化学中数十年的稳定性问题,同时降低了计算要求。该进展有望加速药物发现和材料科学研究。
科学家在计算化学领域取得重大突破,通过应用机器学习解决了量子化学中数十年的困境,能够以显著更少的计算能力精确稳定地计算分子能量和电子密度。这种新的无轨道方法允许对非常大的分子进行计算,包括"类药物"分子,并首次使用这种方法展示了稳定收敛。
这一突破涉及一个名为STRUCTURES25的新过程,它基于专门开发的神经网络,直接从精确的参考计算中学习电子密度与能量之间的关系。该模型以数学上详细的表示捕捉每个原子的化学环境。一个独特的训练概念至关重要:该模型不仅使用收敛的电子密度进行训练,还使用围绕正确解的许多变体进行训练——这些变体通过对基础参考计算进行有针对性的、受控的变化生成。
因此,即使在存在微小偏差的情况下,这种计算过程也能够可靠地找到分子能量和电子密度的物理意义解。它保持稳定,不会在计算中"迷失"。在对大量多样的有机分子集合进行的测试中,STRUCTURES25达到了可以与已建立的参考计算相媲美的精度。初步的运行时间比较证明,计算过程能够更好地随着分子大小的增长而扩展,从而提高计算速度。
电子在分子中的分布决定了其化学性质——从稳定性和反应性到生物效应。可靠地计算这种电子分布和由此产生的能量是量子化学的核心功能之一。这些计算构成了许多应用的基础,在这些应用中必须具体理解和设计分子,例如用于新药、更好的电池、能量转换材料或更高效的催化剂。
在量子化学中,分子经常使用密度泛函理论来描述,该理论允许在不计算量子力学波函数的情况下对化学分子性质进行基本预测。电子密度被用作主要量——这种简化最终使计算变得可行。这种无轨道方法有望实现特别高效的计算,但直到现在仍被认为几乎没有用处,因为电子密度的微小偏差会导致不稳定或"非物理"的结果。
另外,研究人员在分子模拟的量子计算方法方面也取得了进展。使用约10万个物理量子比特,现在可以实现具有20-50个空间轨道的活性空间的分子系统的基态能量估计。经典的全组态相互作用方法被认为是分子电子结构计算的"黄金标准",但在模拟超过约20个电子在20个轨道中的系统时变得计算不足,这种限制被称为"指数墙"。
这限制了对理解化学反应、材料性质和生物过程至关重要的复杂分子的精确模拟。该团队通过将其框架应用于铁硫簇模型,展示了超越简单分子的广泛适用性,铁硫簇在生物电子转移中起着至关重要的作用;细胞色素P450活性位点,在药物代谢和解毒中很重要;以及为二氧化碳利用设计的催化剂。