第二届数字创新论坛隆重召开 翼方健数通过隐私安全计算为临床研究数据溯源和核查赋能
为了加速数字化转型,提高中国临床研究的效率与质量,DIA中国在上海举办第二届数字创新论坛(dTrial),深入探讨临床研究信息化管理(成熟场景),临床研究数字化应用(创新场景)以及临床研究新兴技术(技术专场)。翼方健数CEO罗震受邀参加,并发表题为《隐私安全计算在临床数据中的应用价值》的主题演讲。
第二届数字创新论坛(dTrial)在上海隆重召开
去年疫情中,DIA中国第一届数字创新论坛(dTrial)紧紧围绕临床研究数字化创新的主题,全景式地报告了临床研究电子化、智能化、远程化和一体化等方面的具体进展和实践经验。
2021年后疫情时代下,临床试验数字化升级转型已成为共识,论坛在专题设置上更加注重落地实施方法和实际案例经验。
为了更加深入具体应用场景,除了DIA数字健康社区主办之外,本次论坛特别邀请DIA项目管理社区,DIA法规社区和SMO协作组来组织和主持数字化应用落地专题。
会议邀请到了多位重磅嘉宾到场。针对真实世界数据(RWD)和研究(RWS),各位嘉宾分享了自己深入的见解和宝贵的建议。
获取高质量临床数据 联合计算具有极高应用价值
高质量的临床数据十分珍贵,因为数据是医生科研的基础。在临床研究数字化方面,数据的共享协作面临三大挑战:多模态异构数据VS融合标化、严格的法规保护VS共享开放、建设方VS使用方。
第一,对于多模态异构数据来说,数据没有遵循FAIR原则,临床和组学数据无法有效的治理和融合,并且海量数据向算法端移动,效率较低的同时还会导致高成本和高风险;
第二,数据的隐私安全和开放共享不能兼顾,国际合作中多重监管和本地规范增加了数据分享和分析的复杂维度,缺少符合多方要求的平台解决方案,需要颗粒度的可靠的授权管理机制来解决这一问题;
第三,临床/遗传共享数据通常都是一方建设,多方使用,缺乏开放的生态建设技术手段、缺乏健全的颗粒授权管理、缺乏数据衍生知识产权的保护;
值得一提的是,临床试验需要严格的数据溯源和数据核查。
根据FDA的650份研究核查发现,接近十分之一存在问题,22个存在错误的信息,14个没有报告不良反应,还有42个违背临床试验规范,35个试验记录错误,30个没有保护好患者安全或没做知情同意。
正是由于没有严格的数据溯源和数据核查,导致数据容易被篡改,存在选择性使用数据和弃用数据的情况,同时存在原始数据丢失,数据不能溯源的问题,从而导致实验设计对照无效,生物信息处理和分析没有整合进入数据产生路径。
若想获得一份高质量的临床数据,就需要从技术层面来解决根本问题。但是传统方式下,原始数据在使用时会离开数据平台,失去对于隐私和安全的保护。而通过隐私安全计算方式,原始数据无需离开数据平台,数据在平台内授权使用,平台只输出数据的价值。
隐私安全计算包含前沿计算机科学技术,通过多方安全计算MPC、同态加密、联邦学习、安全沙箱计算、TEE、差分隐私等实现数据隐私安全保护的同时,发挥数据价值。
以隐私安全计算为基石构建生物信息数据计算 互联网
翼方健数CEO罗震表示,目前我国临床试验需要严格的数据溯源和数据核查,这对当前临床研究来说是亟待解决的问题,隐私安全计算技术可解决该困境。
隐私安全计算是指在不对外泄漏数据本身的前提下,实现规范化数据的获取、分析、计算,原始数据不离开数据平台,只输出数据价值。也就是能够保证满足数据隐私安全的基础上,打破数据孤岛,实现数据“价值”和“知识”的流动与共享,真正做到数据的“可用不可见、可控可计量”,实现了风险的可控。
隐私安全计算在医药的实际应用也包含多种计算方式,以联邦学习举例来说,让每个参与方利用自身样本在本地训练AI模型,然后将模型训练的梯度共享,共建全局模型。因此原始数据不需要离开任何特定的设备,就能使互相高度竞争的企业能够安全的共享数据的价值。
在国外,已经有了隐私计算在医药的应用实例:MELLODDY,这个项目是由10家大药厂、2家大学、4家初创企业、1家AI企业共同参与完成。
借鉴国外的经验,行业内各个企业也在探索如何根据我国临床研究的实际发展情况因地制宜的研究出一套解决方案,重点解决两方面的问题:打破数据孤岛、激活数据价值共享。
其中翼方健数也利用这个技术构建了隐私安全计算数据能力平台——翼数坊 XDP平台,同时也是全球第一个 商业 部署的隐私安全计算平台和生态系统。平台支持多种隐私安全计算方式,支持根据不同信任假设和应用场景选择对应的计算方式。
第一个需要解决的问题就是利用隐私安全计算打破数据孤岛。
翼方健数基于隐私安全计算的数据应用开放平台在厦门构建起区域医疗大数据平台。厦门是国家首批医疗健康大数据试点城市,有400万人口,目前已经实现3年内的临床数据覆盖和5年的数据规模。这些数据的覆盖从根本上打破了过去医院之间的数据孤岛情况,在数据价值实现上,已经有多个研究机构和商业导向的用户作为使用方,分享数据的价值。
通过实现数据处理、数据存储、数据计算一体化,构建数据生态,并建设其计算和数据的互联网,让医疗数据在封闭环境内同样也能实现应用输出和价值输出。XDP平台在确保原始数据的隐私和安全保护的前提下,保持数据应用开放。
第二个需要解决的问题是提供方和使用方之间的利益矛盾,促进数据价值共享。
XDP平台建立了基于智能合约的数据共享激励机制。在数据提供方数据集发布的同时,建立智能合约,使用方在数据共享中可以参照智能合约,建立数据价值兑现时的分配方案。
对于多重数据提供方情况,智能合约触发时可以按照衍生关系触发上游智能合约,实现回溯。
解决了以上两个方面的问题之后,就可以利用数据价值,帮助第三方探索AI、物联网等场景的使用。
具体到临床试验中的应用上来看,通过隐私安全计算,医疗数据节点之间不需共享原始数据即可改善临床试验及结果。保证了数据的隐私性和安全性。
在我国智能化进程不断提速下,人工智能企业将于各产业共同突破,通过隐私安全计算,实现数据协作和共享,发挥数据价值,推动医疗医药健康数字产业化前行。