AI向け健康データ共有への支持は、安全対策・同意・公共的利益が条件
英国のフォーカスグループ調査により、AI研究のための健康データ共有への支持は、公共的利益が明確であり、強固な安全対策があり、実質的な同意が確保されることを条件としていることが示された。欧州ではデータ主権を重視する政策の下で生物医学データセットの管理が強化されており、こうした知見の重要性が高まっている。
人工知能研究のために健康データを共有することへの公衆の支持は、明確な公共的利益、強固な安全対策、そして実質的な同意に左右されることが、英国の市民を対象とした詳細なフォーカスグループに基づく新たな研究で示された。各国政府がデータ主権を推進し、機微な生物医学データセットの管理を強化するなか、今回の知見は、AI研究における健康データ共有に関する市民の見方をめぐるエビデンスの蓄積に新たに加わるものである。
研究チームは、英国各地の成人41人を対象に、年齢、民族性、健康上の経験、社会経済的背景の幅を反映するよう選定し、オンラインで8回のフォーカスグループを実施した。参加者は、大学主導の研究、大規模研究データベース、営利企業が関与するプロジェクトなど、AIのための健康データ共有に関する現実的なシナリオについて議論した。
議論全体を通じて、参加者は健康データ共有に対し慎重かつ条件付きの支持を示した。匿名化は広く不可欠とみなされたが、とりわけ希少疾患のある人々や、大規模データセット同士が連結される場合には、万全ではないとも受け止められていた。一定レベルのリスクは避けられないと受け入れる参加者は多かった一方で、データがどのように保護されているのか、また問題が起きた場合に何が起こるのかについて、より高い透明性を求めていた。
誰がデータを利用するのかによって、信頼の度合いは異なった。大学やNHSは概して公共の利益のために行動していると受け止められていた一方、営利組織の関与はより強い懐疑を招いた。ただし、その見方は、営利企業の関与が患者利益と明確に結び付けられ、厳格な監督の下に置かれる場合には、やや和らいだ。
参加者は、データを共有するかどうかを、自身や他者にもたらされる可能性のある利益と、認識されるリスクとを比較衡量して判断していた。差別、不正利用、将来の未知のリスクへの懸念は、ケアの改善、診断の迅速化、将来の患者を助けるといった潜在的利益と天秤にかけられていた。他者の福祉や「より大きな公益」への配慮が重要な動機だと述べた人も多く、特に長期疾患を抱える人や、過去に医学研究の恩恵を受けた経験のある人でその傾向が強かった。
信頼の基盤として、同意は中心的な論点として浮上した。参加者は、個々の研究に即した、明確で具体的かつ関連性の高い情報が、アクセスしやすい形式で提供されることを求めた。また、同意取得のプロセス自体の重要性も強調し、ストレスの高い、あるいは感情的に脆弱な臨床場面で同意を求めることには反対した。提案としては、個別に合わせたアプローチ、データの特定用途についてオプトアウトできる機会、「クーリングオフ」期間、そして後の段階で同意を撤回できることなどが挙げられた。
この議論は、人工知能の超大国化を促す地政学が、生物医学データセットと、それに誰がアクセスできるのかを再編しつつあるなかで進んでいる。オープンサイエンスを後押しする政策が何十年も続いた後、各国政府は現在、機微なデータセットは国家の管理下にとどまるべきであり、外国からのアクセスは条件付きであるべきだとする考え方、すなわちデータ主権を推進している。
欧州では、厳格なプライバシー規則を順守し、欧州のデータ主権を強化しながら、大陸としてAI分野での競争力を維持するよう各国に圧力がかかっている。2025年11月、European Commissionは、加盟国全体の科学データセットを含むAI資源を調整する仮想研究機関であるRAISE(Resource for AI Science in Europe)を立ち上げた。European Commissionによると、Europe’s Genomic Data InfrastructureやCancer Image Europeといったデータベースは、計画中の官民連携AIギガファクトリーに活用され、Horizon Europeは研究者の計算資源利用時間を確保するために**€600 million**を拠出する。
研究者らは、各国や企業が健康記録の周囲に壁を築くにつれ、アルゴリズムは異なる集団間での検証が難しくなり、隠れたバイアスの影響を受けやすくなり、そもそも自らのデータを提供した人々に利益が還元されにくくなると警告している。欧州では、AI開発のためのデータは利用可能ではあるが、それは申請ベースの管理された仕組みを通じてのみである。