AI를 위한 건강 데이터 공유 지지는 보호장치·동의·공익에 달려 있다
영국 포커스그룹 연구에 따르면 AI 연구를 위한 건강 데이터 공유에 대한 지지는 공익, 강력한 보호장치, 실질적인 동의가 보장될 때에만 형성된다. 유럽이 데이터 주권 정책 아래 민감한 생물의학 데이터에 대한 통제를 강화하는 가운데, 이번 결과는 신뢰와 투명성이 데이터 활용의 핵심 조건임을 보여준다.
공중의 건강 데이터 공유에 대한 지지는 분명한 공익, 강력한 보호장치, 그리고 실질적인 동의에 달려 있다고, 영국 일반인을 대상으로 한 심층 포커스그룹에 기반한 새로운 연구가 밝혔다. 각국 정부가 데이터 주권을 내세우고 민감한 생물의학 데이터세트에 대한 통제를 강화하는 가운데, 이번 결과는 AI 연구를 위한 건강 데이터 공유에 대한 대중의 인식과 관련한 증거가 축적되고 있음을 보여준다.
연구진은 영국 전역에서 41명의 성인을 대상으로 온라인 포커스그룹 8개를 진행했으며, 연령, 인종적 배경, 건강 관련 경험, 사회경제적 배경이 다양하게 반영되도록 참여자를 선정했다. 참여자들은 대학 주도의 연구, 대규모 연구 데이터베이스, 상업 기업이 관여하는 프로젝트 등을 포함해, AI를 위한 건강 데이터 공유와 관련한 현실적인 시나리오를 논의했다.
논의 전반에서 참여자들은 건강 데이터 공유에 대해 신중하고 조건부인 지지를 나타냈다. 익명화는 대체로 필수적인 것으로 여겨졌지만, 특히 희귀질환 환자이거나 대규모 데이터세트가 서로 연결되는 경우에는 완벽한 대책으로 보지 않았다. 많은 참여자는 어느 정도의 위험이 불가피하다는 점을 받아들였지만, 데이터가 어떻게 보호되는지, 문제가 발생했을 때 어떤 일이 일어나는지에 대해 더 큰 투명성을 원했다.
누가 데이터를 사용하는지에 따라 신뢰 수준은 달랐다. 대학과 NHS는 대체로 공익을 위해 행동하는 것으로 인식된 반면, 상업 조직의 관여는 더 큰 회의를 불러일으켰다. 다만 상업적 관여가 환자 편익과 명확히 연결되고 엄격한 감독을 받는 경우에는 이러한 인식이 다소 완화됐다.
참여자들은 데이터 공유 여부를 결정할 때 자신과 타인에게 돌아갈 잠재적 이익과 인식된 위험을 저울질했다. 차별, 오용, 미래의 예측하기 어려운 위험에 대한 우려는 치료 개선, 더 빠른 진단, 미래 환자 지원과 같은 잠재적 이익과 함께 고려됐다. 특히 장기질환이 있거나 의학 연구의 혜택을 받은 경험이 있는 사람들 사이에서는 타인의 안녕과 ‘더 큰 공익’을 고려하는 마음이 중요한 동기로 묘사됐다.
동의는 신뢰의 토대로서 핵심 쟁점으로 떠올랐다. 참여자들은 특정 연구에 맞고, 명확하며 구체적이고 관련성이 있는 정보를 접근하기 쉬운 형식으로 제공받기를 원했다. 또한 동의를 구하는 과정 자체의 중요성도 강조했으며, 스트레스가 크거나 정서적으로 취약한 임상적 순간에 동의를 요청하는 데 반대했다. 제안으로는 맞춤형 접근, 특정 데이터 사용에 대한 옵트아웃 선택지, ‘숙려 기간(cooling-off period)’, 그리고 이후 단계에서 동의를 철회할 수 있는 권한 등이 포함됐다.
이 논쟁은 인공지능 초강대국 경쟁을 이끄는 지정학이 생물의학 데이터세트와 그 접근 권한을 재편하는 가운데 전개되고 있다. 수십 년간 개방과학을 장려해 온 정책 이후, 각국 정부는 이제 데이터 주권, 즉 민감한 데이터세트는 국가 통제 아래 남아 있어야 하며 외국의 접근은 조건부여야 한다는 구상을 추진하고 있다.
유럽에서는 엄격한 개인정보 보호 규칙을 지키고 유럽의 데이터 주권을 강화하는 동시에, 대륙의 AI 경쟁력을 유지해야 한다는 압박이 커지고 있다. 2025년 11월 유럽연합 집행위원회(European Commission)는 회원국 전반의 과학 데이터세트를 포함한 AI 자원을 조율하기 위한 가상 연구소인 RAISE(Resource for AI Science in Europe)를 출범시켰다. 집행위원회에 따르면 Europe’s Genomic Data Infrastructure와 Cancer Image Europe 같은 데이터베이스가 계획된 공공-민간 AI 기가팩토리를 지원하는 데 활용될 예정이며, Horizon Europe는 연구자들의 컴퓨팅 시간 확보를 위해 €600 million을 투입할 예정이다.
연구자들은 국가와 기업이 건강 기록 주위에 장벽을 높일수록 알고리즘을 서로 다른 인구집단에 걸쳐 검증하기가 더 어려워지고, 숨겨진 편향에 더 취약해지며, 애초에 자신의 데이터를 제공한 사람들에게 혜택이 돌아갈 가능성도 낮아질 것이라고 경고해 왔다. 유럽에서는 AI 개발을 위한 데이터 이용이 가능하지만, 이는 신청 기반의 통제된 메커니즘을 통해서만 허용된다.