AI와 혈액 바이오마커, 수십 년 전부터 질병 위험 예측 가능성 보여
최근 연구들은 혈액 기반 바이오마커에 AI를 결합하면 질병 위험을 수십 년 앞서 예측할 수 있음을 보여준다. p-tau217은 여성에서 치매 위험을 25년 전부터 예측했으며, 머신러닝은 간의 MYCN niche를 기반으로 간암 위험 환경을 93% 정확도로 식별했고, AI 기반 혈액검사는 1,557개 후성유전 마커로 전당뇨 고위험군을 약 90% 정확도로 분류했다.
한 연구에서 알츠하이머병에서 관찰되는 뇌 변화와 연관된 단백질인 혈액 기반 바이오마커 ‘phosphorylated tau 217’ 검사를 통해 증상이 나타나기 25년 전부터 여성의 치매 발병 위험을 예측할 수 있을 가능성이 확인됐다. phosphorylated tau 217, 즉 p-tau217 수치가 높을수록, 연구 시작 시 인지 기능이 정상인 고령 여성에서 향후 경도인지장애와 치매(가장 흔한 형태는 알츠하이머병) 발생과 강하게 연관됐다.
The Journal of the American Medical Association (JAMA) Network Open에 게재된 이번 연구는 1990년대 후반 65~79세 여성을 등록해 최대 25년간 추적한 미국 국가 연구인 Women's Health Initiative Memory Study 참가자 2,766명의 데이터를 분석했다. 추적 관찰 기간 동안 치매를 포함한 기억력 또는 사고력 문제가 발생한 여성들이 확인됐다.
연구 시작 시점의 혈중 p-tau217 수치가 높을수록 이후 생애에서 치매가 발생할 가능성이 더 높았으며, 바이오마커 수치 증가에 따라 치매 위험도 함께 증가하는 양상이 나타났다. 또한 p-tau217 수치가 높을수록 70세 이상 여성에서(그보다 젊은 여성과 비교해) 더 나쁜 인지 결과와의 연관성이 더 강했고, 알츠하이머병의 유전적 위험인자인 APOE e4 보유자에서도 그 연관성이 더 뚜렷했다.
연구는 또 p-tau217가 위약 대비 에스트로겐+프로게스틴 호르몬 치료에 무작위 배정된 여성에서 치매를 더 잘 예측했다고 보고했다. p-tau217와 같은 혈액 기반 바이오마커는 뇌 영상검사나 뇌척수액 검사보다 훨씬 덜 침습적이며 잠재적으로 접근성이 높다는 점에서 특히 유망하다.
간암에 관한 별도의 연구에서는 일본의 한 연구팀이 MYCN이라는 특정 단백질에 주목했다. 과학자들은 이미 이 단백질이 손상된 간에서 간암에 관여한다는 사실을 알고 있었지만, 그 기전은 명확하지 않았다. 이를 규명하기 위해 연구진은 마우스 모델을 이용해 MYCN이 과도하게 증가할 때 어떤 일이 일어나는지 관찰했다. 그 결과 MYCN이 AKT라는 또 다른 유전자와 결합했을 때, 단 50일 만에 마우스의 72%에서 종양이 발생했다.
이 현상이 발생하는 이유를 이해하기 위해 연구팀은 spatial transcriptomics라는 기법을 사용했다. 그들은 MYCN 수치가 상승할 때 ‘종양이 없는’ 영역에서 변화하는 167개 유전자의 특정 군집을 발견했다. 연구진은 이 환경을 ‘MYCN niche’로 명명했다.
이 데이터를 바탕으로 연구진은 머신러닝 모델을 구축했다. 이 알고리즘은 간의 유전자 패턴을 분석해 점수를 부여하며, 점수가 높으면 간 환경이 암 발생에 유리하게 ‘준비된’ 상태임을 의미한다. 이를 인간 데이터에 적용해 시험했을 때 93%의 정확도로 작동했다. 흥미롭게도, 종양 자체보다 종양 주변의 겉보기 정상 조직을 분석했을 때 이 점수가 향후 문제를 예측하는 성능이 더 뛰어났다.
한편 German Center for Diabetes Research (DZD) 소속 과학자들은 간단한 혈액검사에 AI를 결합하면 제2형 당뇨병과 그 합병증 발생 위험이 높은 사람을 조기에 선별하는 데 도움이 될 수 있다고 제시했다. Biomarker Research에 발표된 새 연구는 전당뇨 위험 프로파일이 알려진 여러 연구 코호트 참가자들의 혈액 샘플을 분석했다.
연구진은 DNA 염기서열 자체를 바꾸지 않으면서 유전자 활성을 조절하는 화학적 변형인 DNA methylation 패턴에 주목했다. 머신러닝 기법을 이용해, 연구팀은 전당뇨 위험의 생물학적 ‘지문’을 구성하는 1,557개의 후성유전(epigenetic) 마커를 확인했다.
이 마커들을 사용해 AI 모델은 독립적 검증 코호트에서 시험했을 때도 약 90%의 정확도로 개인을 고위험 전당뇨 클러스터에 배정할 수 있었다. 많은 후성유전 마커는 특정 클러스터에 특이적이었고, 서로 다른 생물학적 신호전달 경로를 반영했다. 그중 여러 마커는 이전 연구에서 제2형 당뇨병, 만성 염증, 심혈관 및 신장 질환과 이미 연관된 것으로 보고된 바 있다.
DZD가 수행한 이전 연구에서는 전당뇨를 최소 6개의 서로 다른 클러스터로 구분했다. 이 중 3개 클러스터는 중등도 위험과 연관됐고, 나머지 3개는 제2형 당뇨병 및 관련 합병증으로 진행할 고위험을 보였다.