医疗大数据时代,“技术善”与“伦理善”之争
随着 云计算 、基因测序、现代临床试验、靶向治疗等技术的发展, 大数据 和 医学 将进行高度融合,实现颠覆性的医疗,医疗卫生行业进入大数据时代。 医疗大数据 将在临床辅助决策、医疗质量监管、疾病预测模型、临床试验分析、个性化治疗等医疗服务领域发挥巨大作用。但不容忽视的是,当前大数据在医疗卫生行业的应用中带来一些伦理挑战,如个人隐私信息的泄露、知情同意的难以贯彻、人文关怀的缺失,甚至人的存在方式、医患交往方式等都发生变化,如何应对这些挑战,使其合理应用,成为当前伦理学亟需解决的问题。
1、医疗大数据的概念及特征
医疗大数据是指利用常规软件工具捕获、管理和处理数据所耗时间超过可容忍时间的医疗领域的数据集。医疗大数据的典型特征主要表现为四个方面。
1.1数据集成的广泛性
医疗大数据规模大、海量,通常是以GB、TB、PB为基本处理单位。例如,医院CT、核磁等影像资料的数据量每天超过100G,并需要长期保存,而且,种类繁多,来源广泛。医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和食品安全、养生保健等。其数据主要来源于制药企业、医院诊疗、医疗费用和健康管理四个方面。
此外,医疗大数据具有广泛的异构性,很多数据是半结构化、非结构化的,其所占比例越来越多,如电子病历、影像资料等,其中,病理资料是以图片形式呈现的,因而是一种半结构化数据。
1.2数据潜在的价值性
医疗大数据不仅作为处理对象单个存在,而且还是一种基础资源,其存在是判断其他数据存在的依据,能够协同解决其他领域的问题。单个医疗数据信息价值不是很明显,一旦通过智能分析和计算机技术整合,对数据进行二次开发,就会产生很大的潜在价值。正如经济学家 Hal Varian 所说:“数据收集的根本目的是通过整合、分析、提取有用的知识,并将其应用到具体的领域当中。”
美国罗切斯特大学(University of Rochester)一个数据挖掘团队就曾利用Twitter的数据进行了尝试。他们利用自己开发的文本分析工具,一个月内收集60余万人的440万条Twitter信息,挖掘其中的身体状态信息。结果表明,研究人员可以提前8天预报流感对个体的侵袭状况,而且准确率高达90%。
1.3数据分析的相关性
相关性是指两个或两个以上变量的取值之间存在某种规律性。变量之间有相关性,只反映取值的影响度和相关的密切度,并不代表有因果性。数据分析是整个医疗大数据的核心,价值产生于分析过程。
首先,医疗大数据是一个复杂开放的系统,其中各个部分相互影响,相互关联。此时的“因”可能是彼时的“果”,此处的“果”也可能是彼处的“因”。因此,传统的线性因果分析模式无法对医疗大数据进行分析。例如,有统计结果显示,吸烟人群的肺癌发病率比不吸烟人群高几倍,但统计学无法得出“吸烟致癌”的因果结论。只能提示,吸烟与肺癌有相关性。
其次,医疗大数据的潜在价值性,使得“数据思维从以计算为中心转为以分析为中心,即在一定的理论指导下,按照一定的社会需求,收集、整理和分析数据,从而进行社会解释、监控、预测与规划的过程和活动”。
谷歌搜索每天产生海量的数据。就以搜索流感信息为例,尽管并不是每个搜索这类关键词的人都有流感症状或患有流感,但把这些数据汇总到一起时,或许可以从中建立起一个准确、可靠的模型,实时监控当下的流感疫情,并对未来疫情状况进行估测。2008年11月谷歌公司上线了“谷歌流感预测”(Google Flu Trends,GFT),即通过监测某一地区与流感相关检索词的数量,用来估计该地区流感疫情。谷歌公司将GFT推广到美国在内的其他28个国家,并对新西兰的流感预测,其结果与当地监测结果高度相关。不仅如此,在2008年季度GFT模型预测的结果与美国国家疾病预防控制中心流感样病例监测结果也保持了高度相关性,其相关系数为0.97。
在每一份基因电子病历中,记载着个人的所有潜在疾病及对药物的敏感信息。医生根据基因电子病历中的数据,结合患者的生理指标和医疗智能决策支持系统,进行相关性分析,模拟临床治疗的有效性,最终形成一个个性化的医疗模式。如Melanie Nix的家族有乳腺癌病史,在2008年,进行与乳腺癌有关的乳腺癌1号基因(breast cancer 1,BRCA1)基因突变检测时,结果呈阳性。医生根据这一数据结果,结合Melanie Nix的各项生理指标,进行相关性分析,制定了一个精准治疗方案,最终经过16轮的化疗和乳房重建手术,Melanie Nix现在已经完全治愈了癌症。显然,相关性分析是医疗大数据分析的一个重要思维模式。
1.4数据解释的不确定性
斯坦福大学Trevor Hastie认为:“海量数据带来显著性检验的问题,将使我们很难找到真正的关联。”维克托·迈尔·舍恩伯格等也指出这一点:“数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库。”
海量的半结构化、非结构化数据聚集在一起时,就会产生很多干扰数据,也意味着更多的虚假关系信息,导致分析结果的不精确。2012年~2013年,GFT高估了流感疫情的起始时间以及流行程度,流行性感冒提前袭击了美国,造成严重危害。当时科学家们检索并分析流感相关的互联网数据,对流感的影响程度进行估计。
然而与传统的公共卫生监测方法相比,这种方法大大高估了流感的高峰期影响水平。Declan Butler也指出,GFT对2012年底美国流感类疾病患者数目的估计比美国疾病控制与预防中心检测结果高出约1倍。不仅如此,GFT在2008年~2009年对瑞士、德国、比利时等国的流感类疾病患者数目的估计也都失准。
医疗数据解释的不确定性,一定程度上会给受检者带来误导,甚至产生不必要的恐慌。正如美国医学遗传学会通过基因测试,反馈许多有关遗传变异信息时对受检者说:“我们发现你的基因中的这些变异是重要的,但不知道它们是否会让你生病或者产生其他病变。”目前通过耳聋基因诊断只能诊断出60%~80%遗传性耳聋的准确致病基因,依然有20%~40%的基因无法确定,也就无法给受检者一个准确的数据结果说明。显然,如此不确定的医疗数据解释,势必给受检者带来潜在心理负担。
2、医疗大数据应用的伦理思考
医疗大数据是颠覆个人健康的一次重大革命,基因测序、无线传感器、靶向治疗等与其他学科结合将使医疗更具个性化。但是,医疗大数据在具体应用中仍然带来一定的 伦理问题 。迈克尔·桑德尔(Michael J. Sandel)指出:“当伦理道德跟不上科技的脚步时,人们的心理就会不安。”正是这种不安促进反思。
2.1个人隐私与信息安全
在医疗大数据时代,随着社交媒介Twitter、移动APP、远程医疗等在医患之间的广泛应用,患者的诊断信息、具体病症、生活习惯等隐秘信息都在互联网上留下痕迹。现有的隐私保护技术主要基于静态数据集,医疗大数据的海量、动态、共享、交叉检索等典型特征,增加了个人信息泄露的危险。
据美国卫生部民权办公室统计,仅2015年第一季度全美就发生87起数据泄露事件,受影响医疗机构达500多家,共计9230万个人信息泄露。国内媒体也曾曝出医药信息外泄事件,如温州多家医院的信息系统遭黑客入侵,罗维邓白氏公司非法买卖公民个人信息事件等。
此外,由于医疗大数据进行二次利用后,能产生无法估量的价值,所以一旦暴露,其危害往往是个人无法预知和控制的。因此有人认为,“医疗大数据时代,随着信息的累积和整合,真正的危险是被预知和蚕食人类的自由”。难怪有人担心,将一生的病历记录存储在云端,简直令人恐惧。
信息泄露给个人和社会带来的经济损失不容忽视。根据美国独立研究机构波莱蒙研究所(Ponemon Institute)一份有关数据风险的最新研究报告——《2015年数据泄露成本研究》称,全世界范围内医疗保健信息泄露的平均成本是每条记录363美元,而美国为398美元。
2.2知情同意
知情同意是指主体在充分知晓自己个人信息被利用的范围、方式和后果后,自主做出如何处理个人信息的决定。在医疗大数据时代,数据的潜在价值大多体现在数据的二次分析上,而在收集数据时,这些数据会被谁利用以及其用途可能是未知的,因此也就无法告知用户。然而现实是,很多研究机构在没有征得数据所有者明确同意的情况下,默认其同意,就对数据进行二次开发利用,这显然违背了知情同意原则。
2013年美国一个印第安小部落向法院提出诉讼,状告亚利桑那州立大学的研究人员未经知情同意便采集其DNA样品,而当时只是被告知其DNA样品将用于糖尿病研究。事实上,这些数据后来被用于更广泛的研究,如精神分裂症研究。
2000年12月20日,美国《华盛顿邮报》上登载了一篇题为“挖掘农村DNA富矿”的报道,自1995年以来,在哈佛大学公共卫生学院徐希平的协助下,安徽大别山附近数以万计的百姓为哈佛大学与中国的合作项目“贡献”了血样,这些血样进入了哈佛基因库,最终用于对哮喘病、糖尿病和高血压等疾病的研究,而当时百姓只被告知做免费体检。可见,目前海量的数据二次利用时,再次征得用户的知情同意,无论经济成本,还是时间效度都难以实施。所以,医疗大数据时代,真正的知情同意很难贯彻实施。
2.3去主体化与人文关怀
医疗大数据的应用试图通过数据表征人类的一切活动,如生命体征、疾病信息、生活环境、教育程度、饮食习惯等,从而构建一个数字化时代。人类利用数据信息创造了一个数字人体,真实地复制了人的解剖学、生理和生物数据。
但是,医疗大数据的应用带来一个客观问题,那就是“去主体化”,即在人与数字的相互交往中,大数据汇集,数字脱离主体而存在,作为主体的人被数字代替,数字反而成为主体。
有学者指出,“当代医学技术已经处于主体地位,并且开始无限制地介入和干预身体,将具有丰富感受性的身体仅从生物学意义上加以对待,人内在的情感、价值和尊严等生命意义被遮蔽,愈来愈明显地体现为一种‘去主体化’倾向”。
一方面,对医务人员而言,由于对疾病的诊断和治疗过度依赖数据,从而可能限制自己的思维,失去传统的临床经验。丹尼尔·奥弗莱(Danielle Ofri)曾坦言:“描述患者病情受一千个字符的限制,这限制了医生的思考。电子病历系统要求分类记录病情,将患者的状况按不同方面输入不同的区域,这导致医生难以对患者形成完整的印象。”
另一方面,对患者而言,由于被各种数据所标记,成为一个没有思维、意识和情感的数字符号,患者的疾苦也变成了一堆数字和影像,人的主体性丧失。这样一来,医患交往时,医生的关注点由患者转向各种数据,似乎需要面对更多的计算机,而非患者。患者也难免对医生通过敲击键盘、盯着电脑屏幕就能看病感到疑惑,感觉自己没有被真正倾听和理解。那么,医患间的接触倾听、耐心沟通、情感抚慰、价值认同等人文关怀就会受到蚕食。例如,目前Diabetic Link建立的患者医疗健康网络社区,通过网络进行交流治疗经验和疾病信息等。但是,这样的交流只能看到双方的脸部和上半身,医生无法感知患者的体态言语、细微的情感和行为变化,更何谈医学的人文关怀。
医学终极关怀是对生命价值的高度体认,肯定人是一种精神和文化的存在。然而,“现代医生专注于诊断治疗的器械化、数字化和计算机化而偏离关注病人的心理、精神,从而割裂了医学与人文的结合”。
3、应对医疗大数据伦理问题的对策
医疗大数据应用的伦理问题解决,需要在医学伦理学理论、原则指导之下,坚持以人为本,多部门协调合作,共同配合。如此,医疗大数据才能更好地为人类健康服务。
3.1加强信息技术的研发应用,注重综合性人才培养
医疗大数据的应用涉及到医学、计算机、伦理学、法学等不同学科的交叉。因此,需要多学科共同解决和论证医疗大数据的问题。
首先,加强数据安全技术的研发和更新,通过采取技术手段限制用户对医疗信息资源的权限管理,从而使得各类医疗大数据在合法范围内使用,防止资源被滥用造成泄露隐私,产生安全问题,如有人提出的“医疗隐私层次化控制”。
其次,要加强计算机技术的研发,如数据挖掘技术、整合技术等,从技术上加强对医疗大数据的深度挖掘,将数据的真实性、关联性、潜在价值性给挖掘出来。
最后,注重综合性专业人才的培养,既熟通医学专业知识、计算机知识,又贯通伦理学、法学知识。深度挖掘医疗大数据的真实性和潜在价值性,如此,方能在应用医学科技的同时,追求更高层次的“伦理善”,成为一个有学养的医务工作者。
3.2法律和伦理协同制约
在医疗大数据时代,对原有的法律规范、伦理道德进行修补,已经不足以抑制其带来的伦理风险。因此,要重新制定新的法律,约束医务人员的行为,提高自律意识和保护患者隐私的意识。
首次,加强立法,通过法律保护患者隐私权利。如美国制定《基因隐私法》,《欧洲联盟基本权利宪章》第八条规定个人信息受保护的权利。另一方面,医务人员在遵守不伤害、有利、公正等伦理原则的前提下,寻找相应的伦理对策。如有学者提出“动态的知情同意”,它是一种以患者/受试者为中心的同意,符合医疗大数据时代的个性化需求。还有学者提出将动态同意与宽泛同意相结合的“元同意”。总之,在应用医疗大数据时,需要法律和伦理协同规范医务人员行为,加强医务人员的法律意识和伦理道德。
3.3重视人的主体地位,加强人文关怀
黄万盛认为:“人文关怀就是把天道的合理性跟人存在的合理性完全打通。真正把‘人’当作一个有创造性的主体,与‘天道’的关怀结合起来。”康德也强调人的主体性,认为“人是目的,不仅仅是手段”。医疗大数据时代,个人数字化是必然结果,但在面对数字化人体时,必须强调人的主体性,使科学技术成为符合人的目的、以人为中心的人性化科技,使人与科技的关系成为人与科技的生态,而不是成为机器与机器、数字与数字僵硬的状态。所以,现代医生在利用大数据时,不能失却自我主体性,重视医学人文关怀,通过智慧、自我经验与患者沟通交流。
医学人文关怀不仅要关注患者的躯体健康,还应关注其心理健康。人是躯体和心理的统一体,有复杂的情绪情感、心理需要和精神追求,这些都会影响疾病的演变过程。因此,医生应站在患者的角度体察、帮助、抚慰患者,耐心沟通,充分尊重患者。不能把患者仅仅视为一个有各种数据标签的“虚拟个体”,而应该尊重患者的自主性,包括自由、理性、尊严、责任等基本价值,充分体现医疗实践中的伦理和道德价值。医学的终极关怀是敬畏生命,尊重人的生命价值。任何时候,医学都只是手段,而不是健康的主宰。
综上所述,医疗大数据的应用顺应时代潮流,是一个重大的系统工程。因此,我们在追求医学“技术善”的同时,更要强调“伦理善”,重视人的主体性,尊重患者的生命价值。综合考虑多方面因素,从信息技术、法律政策、伦理规范等对医疗大数据的应用做出具体的应答。
2018年3月23日,亿欧将在广州举办
GIIS 2018第三届医药未来领袖峰会
,就跨界玩家、创新药研发、产业基金、CRO、两票制、处方外流、医院和药店管理运营等热门话题,携手业界大咖进行交流分享,以期在认知层和方法论给行业带来新思考、新启发。