健康数据为AI共享的支持取决于保障措施、知情同意和公共利益
一项英国焦点小组研究发现,公众支持为人工智能共享健康数据是有前提的,前提包括明确的公共利益、强有力的保障措施以及有意义的知情同意。与此同时,欧洲正依据数据主权政策加强对生物医学数据集的控制。
公众对为人工智能研究共享健康数据的支持,取决于明确的公共利益、强有力的保障措施以及有意义的知情同意。这是基于英国公众成员深度焦点小组访谈的一项新研究得出的结论。随着各国政府也在推动数据主权并加强对敏感生物医学数据集的控制,这些发现为有关公众如何看待为AI研究共享健康数据的证据不断增加的文献提供了新的补充。
研究人员开展了8个在线焦点小组,纳入来自英国各地的41名成年人,受试者的选择旨在反映不同年龄、族裔、健康经历和社会经济背景。参与者讨论了涉及为AI共享健康数据的现实场景,包括大学主导的研究、大型研究数据库,以及涉及商业公司的项目。
在整个讨论过程中,参与者对健康数据共享表达了谨慎且有条件的支持。匿名化被普遍视为必不可少,但并非万无一失,尤其是对罕见病患者,或在多个大型数据集相互链接的情况下。许多参与者接受一定程度的风险不可避免,但希望更透明地了解数据如何受到保护,以及一旦出现问题将会发生什么。
信任程度因数据使用者不同而有所差异。大学和NHS通常被视为基于公共利益行事,而商业组织的参与则引发了更强的怀疑。不过,如果能够明确表明商业参与与患者获益相关,并受到严格监督,这种看法就会有所减弱。
参与者在决定是否共享数据时,会权衡感知到的风险与对自己及他人的潜在收益。对歧视、滥用以及未来未知风险的担忧,会与改善医疗照护、加快诊断以及帮助未来患者等潜在益处进行比较。许多人表示,对他人福祉以及“更大利益”的关切是重要动机,尤其是那些患有长期疾病或曾因医学研究受益的人。
知情同意作为信任基础中的核心问题凸显出来。参与者希望获得针对特定研究、清晰、具体且相关的信息,并以易于获取的形式呈现。他们还强调征求同意这一过程本身的重要性,反对在压力大或情绪脆弱的临床时刻提出请求。相关建议包括采用个性化方式、允许对某些数据用途选择退出、设置“冷静期”,以及允许在后期撤回同意。
与此同时,推动人工智能超级强国竞争的地缘政治因素,正在重塑生物医学数据集及其访问权归属。在经历了数十年推动开放科学的政策之后,各国政府如今正倡导数据主权——即敏感数据集应保留在国家控制之下,外国访问应以满足特定条件为前提。
在欧洲,各国一方面面临保持欧洲在AI领域竞争力的压力,另一方面又必须遵守严格的隐私规则并强化欧洲数据主权。2025年11月,欧盟委员会启动了RAISE(欧洲AI科学资源),这是一个用于协调成员国间AI资源(包括科学数据集)的虚拟研究机构。欧盟委员会表示,Europe’s Genomic Data Infrastructure和Cancer Image Europe等数据库将被用于服务计划中的公私合作AI超级工厂,而Horizon Europe将投入6亿欧元,以确保研究人员获得计算时间。
研究人员警告称,随着各国和企业围绕健康记录筑起高墙,算法将更难在不同人群中得到验证,更容易产生隐性偏倚,也更不可能让最初贡献其数据的人群受益。在欧洲,数据可用于AI开发,但只能通过受控的、基于申请的机制来获取。