디지털 도구와 예측 모델, 신약 발굴에서 입지 넓혀

신약 개발 기간이 10~14년에 이르고 승인 확률도 낮은 가운데, 디지털 신약 설계 도구와 AI가 신약 발굴 전반에서 빠르게 입지를 넓히고 있다. 최근 연구들은 컴퓨터 지원 신약 설계에 AI가 폭넓게 통합되고 있으며, 정보이론적 예측 모델과 하이브리드 신경망이 새로운 약물 후보 탐색에도 활용될 수 있음을 보여준다.

디지털 신약 설계 도구AI가 신약 발굴에 통합되고 있다. 성공적인 신약이 발굴에서 승인에 이르기까지 걸리는 일반적인 기간이 10~14년 또는 그보다 더 길어지기도 하기 때문이다. 신약을 시장에 출시하는 데 드는 비용은 수억 달러에서 수십억 달러에 이를 수 있으며, 임상시험에 진입한 약물 가운데 FDA 승인을 받는 것은 약 **12%**에 그친다.

승인된 신약 1건당 연구개발 비용에 대한 공개 추정치는 방법론과 포함 항목에 따라 큰 차이를 보인다. 영향력 있는 한 분석은 2013년 달러 기준으로 비용을 자기부담 비용 $1.4 billion자본화 비용 $2.6 billion으로 추정했다. 반면 FDA 승인에 대한 공공데이터 분석에서는 신규 약물을 시장에 출시하기 위한 자본화된 연구개발 투자의 중앙값을 기본 사례 분석에서 $985.3 million, 평균 투자를 $1,335.9 million으로 추산했다. 매몰된 개발비를 포함해 후기 단계 시험 실패와 관련된 손실의 재무적 비용은 $800 million~$1.4 billion에 이를 수 있다.

임상 개발 성공률은 질환과 데이터셋에 따라 다르다. 2011~2020년 프로그램을 대상으로 한 대규모 벤치마크에서는 **1상부터 승인까지 전체 승인 가능성을 약 7.9%**로 추정했으며, 종양학은 이보다 낮은 약 **5.3%**였다. 전임상 시험에 들어간 화합물 가운데 극히 일부만이 최초 인체 대상 연구(first-in-human studies)로 진전한다.

신약 발굴과 관련된 긴 기간과 높은 비용은 희귀질환 환자의 의료 수요 공백으로 이어졌다. 전 세계 인구의 3.5%~5.9%, 즉 약 2억6300만~4억4600만 명이 희귀질환을 앓고 있지만, 이들 중 **95%**는 미국에서 FDA 승인 치료 선택지를 갖고 있지 않다. 이처럼 높은 실패율로 자금과 시간이 낭비되기 때문에, 대부분의 시험은 약물이 시장에 도달할 경우 더 큰 수익을 기대할 수 있는 보다 흔한 질환에 집중된다.

오늘날 디지털 신약 설계는 화합물이 생물학적 표적과 어떻게 상호작용하는지를 모델링하는 분자 시뮬레이션, 방대한 화학 라이브러리로 학습해 약물 후보를 예측하는 머신러닝 모델, 완전히 새로운 분자 구조를 제안하는 생성형 AI, 그리고 계산 예측을 물리적 실험과 연결하는 실험실 자동화 플랫폼을 포괄한다. 2020년대에는 AI와 머신러닝이 컴퓨터 지원 신약 설계 접근법에 통합됐고, 딥러닝 모델은 전례 없는 수준의 예측 정확도를 가능하게 했다. AlphaFold와 기타 생성형 AI 도구는 구조 예측과 분자 설계를 혁신했다.

1970년대 이전의 신약 발굴은 우연한 관찰과 시행착오식 스크리닝이 지배했다. 1970년대부터는 계산 기법을 활용한 컴퓨터 지원 신약 설계가 등장했고, 적용은 1980년대와 그 이후에 걸쳐 점차 확대됐다. 2000년대에는 구조생물학, 유전체학, 생물정보학이 컴퓨터 지원 신약 설계 발전을 이끌기 시작했고, 단백질 및 화학 라이브러리는 기하급수적으로 확대됐으며, 가상 스크리닝은 표준 관행이 됐다.

최초의 AI 설계 약물은 현재 임상시험을 거쳐 개발이 진행되고 있으며, 기업들은 처음부터 끝까지 아우르는 AI 파이프라인을 입증하고 있다. 한 추정에 따르면 AI 신약 발굴 시장은 2025년 $4.6 billion에서 2034년까지 $49.5 billion으로, 연평균 30% 복합성장률로 성장할 전망이다.

최근 한 논문은 신약 설계를 위한 생물학적 시료 스크리닝 결과 집합에 대해 **정보이론적 예측 모델 (information-theoretic predictive models)**을 분석했다. 기존 도구들이 주로 SMILES 입력으로부터 확률론적 생물학적 활성 스펙트럼을 제공하는 것과 달리, 제안된 시스템은 구조 기반 데이터와 생물학적 시료 데이터를 이용해 약동학 및 약력학 과정을 동적으로 시뮬레이션할 수 있도록 정보이론적 예측 모델과 통합된 **하이브리드 신경망 (hybrid neural network)**을 포함한다. 생물학적 시료의 특징 집합을 바탕으로 2개의 활성 시료가 선택됐으며, 이들은 높은 신뢰도로 formyl peptide receptor 기반 약물을 만드는 데에도 적합한 것으로 나타났다.

이 논문은 연구자들이 클래스 정보 초상(class information portraits)을 사용해 바이오시료의 가장 중요한 특성을 선택할 수 있으며, 이를 통해 신약 개발에 필요한 노력을 줄이고 예측 정확도를 높일 수 있다고 밝혔다. 특징 기여도 분석에서는 바이오시료의 활성 상태에 긍정적으로 영향을 미치는 특징들이 확인됐고, 그 영향의 강도도 함께 규명됐다.

Related Entities

Companies

Related Articles

References

  1. From data to discovery: The rise of information-theoretic predictive models in drug development · nature.com
  2. America Can't Afford to Slow Medical Innovation - Americans for Tax Reform · atr.org
  3. How digital tools and AI are accelerating drug discovery · drugdiscoverytrends.com