AI 모델, 신약 개발 속 분자 특성 예측 능력 비약적 향상
표행 분자 특성 예측력을 높이기 위해 멀티모달 학습 프레임워크인 M2UMol, 계층적 신경망 HimNet, 그리고 수용체 결합 열역학 분석 등 세 가지 혁신적인 계산 기법이 공개되었다. 이러한 AI 및 물리 기반 모델들은 신약 후보 물질의 선택성을 정교하게 예측함으로써 신약 개발의 성공률을 높이는 데 기여할 것으로 기대된다.
연구진은 분자 특성 예측과 신약 설계를 개선하기 위해 서로 다른 세 가지 계산 접근법을 개발했다. 이는 원하는 특성을 가진 분자를 발견하는 것이 매우 중요한 제약 개발 분야의 핵심 과제들을 해결해준다.
M2UMol이라 불리는 멀티모달 사전 학습 분자 표현 학습 프레임워크는 2D 모달리티(modality)를 여러 모달리티와 개별적으로 매칭하고, 모달리티 분류기와 함께 공동 사전 학습을 거친다. 이 프레임워크는 멀티모달 지식을 2D 모달 인코더로 전이하며, 사전 학습 단계에서 불완전한 모달리티를 입력하는 것을 허용한다. 2D 모달리티만 주어지는 하위 작업(downstream tasks)에서 M2UMol은 사전 학습된 2D 모달 인코더를 기반으로 분자의 멀티모달 정보를 정밀하게 시뮬레이션할 수 있다. 종합적인 실험 결과에 따르면, M2UMol은 광범위한 분자 관련 작업에서 우수한 성능을 보여주었으며 기존 모델들보다 사전 학습 효율성도 높았다. 사전 학습 데이터셋의 원시 데이터는 공공 데이터셋인 DrugBank에서 가져왔으며, M2UMol 기반의 사용자 친화적 패키지는 분자 표현 학습, 주요 기능기 분석 및 분자 멀티모달 검색 기능을 통합 제공한다. 코드와 사전 학습된 가중치 및 패키지는 해당 GitHub 주소에서 확인할 수 있다.
별도의 접근법인 계층적 상호작용 메시지 네트워크(HimNet)는 계층적 상호작용 메시지 전달 메커니즘을 사용한다. 이는 계층적 주의 집중 가이드 메시지 전달(hierarchical attention-guided message passing)을 통해 원자, 모티프(motif) 및 분자 수준 전반에 걸쳐 상호작용을 인식하는 표현 학습을 가능하게 한다. 이러한 설계를 통해 HimNet은 전역 정보와 지역 정보의 균형을 효과적으로 맞추어, 하위 특성 예측 작업을 위한 풍부하고 관련성 높은 특징 추출을 보장한다. 이 시스템은 8개의 널리 사용되는 MoleculeNet 벤치마크와 대사 안정성, 말라리아 활성 및 간 마이크로솜 제거율(microsomal clearance)과 같은 고부가가치의 난이도 높은 3개 데이터셋을 포함한 총 11개 데이터셋에서 정교하게 평가되었다. 광범위한 실험을 통해 HimNet이 대부분의 분자 특성 예측 작업에서 최고 또는 최상위권 성능을 달성함이 입증되었다. HimNet의 커스텀 코드는 Zenodo 및 GitHub 저장소에 MIT 라이선스로 공개되어 있다.
열역학적 분석에 초점을 맞춘 보완적 연구에서는 도쿄 과학 대학교 생명시스템공학과 교수팀이 히스타민 H1 수용체(H1R)의 결합 열역학을 체계적으로 조사했다. 히스타민 H1 수용체는 인체 내에서 알레르기 반응, 염증, 혈관 투과성, 기도 수축, 각성 및 인지 기능을 조절하는 데 핵심적인 역할을 하는 GPCR 아형이다. G-단백질 결합 수용체(GPCR)는 호르몬, 신경전달물질 및 약물을 인식하여 다양한 생리적 과정을 조절하는 인체 내 가장 큰 세포 표면 단백질 가족 중 하나로, 현재 시판 중인 약물의 30% 이상이 이를 표적으로 삼고 있다.
연구팀은 출아 효모 발현 시스템을 통해 준비된 H1R에 대한 doxepin 기하 이성질체(E- 및 Z-이성질체)의 열역학적 특성을 등온 적정 열량계(ITC)와 분자 역학 시뮬레이션을 사용하여 성공적으로 측정했다. 삼환계 항우울제인 doxepin은 또한 H1R을 표적으로 하는 강력한 항히스타민제이며 E- 및 Z-이성질체의 혼합물로 존재한다. 분석 결과, Z-이성질체는 E-이성질체보다 H1R 결합 친화도가 약 5배 더 높았다. 연구진은 이러한 이성질체 의존적 선택성에 기여하는 핵심 트레오닌 잔기(Thr1123.37)를 확인했다.
연구진은 야생형(H1R_WT)과 Thr1123.37 잔기를 다른 아미노산으로 교체한 T1123.37V 돌연변이 수용체, 두 가지 변이체를 합성했다. 결과적으로 H1R_WT와 T1123.37V 돌연변이 수용체 사이에서 doxepin 상호작용의 결합 에너지 차이는 없었으나, 엔탈피와 엔트로피의 기여도는 달랐다. H1R_WT에 대한 결합은 주로 엔탈피에 의해 주도된 반면, 돌연변이 수용체에 대한 결합은 엔탈피 기여도가 줄어든 대신 상대적으로 큰 엔트로피 기여도가 관찰되었다.
Z-이성질체의 H1R_WT 결합은 E-이성질체에 비해 더 큰 엔탈피 이득과 더 큰 엔트로피 손실(penalty)을 수반했다. 이러한 차이는 T1123.37V 돌연변이 수용체에서는 나타나지 않았다. Z-이성질체의 결합 에너지는 H1R_WT에서 E-이성질체보다 높았던 반면, 돌연변이 수용체의 경우 두 이성질체의 결합 에너지가 비슷했다. 이러한 관찰 결과는 리간드 결합 과정에서 엔탈피 이득과 엔트로피 손실의 균형을 맞추는 데 있어 Thr1123.37의 역할과, 특히 Z-이성질체와의 상호작용에서 그 효과가 더 두드러짐을 강조한다.
분자 역학 시뮬레이션 결과, Z-이성질체의 높은 결합 친화도는 형태적 제약(conformational restrictions)에서 비롯된 것으로 나타났으며, 이는 결합 시 관찰된 높은 엔탈피와 감소된 엔트로피 수치와 일치한다. 이 연구는 2026년 1월 26일 ACS Medicinal Chemistry Letters 온라인판에 게재되었다.