京东健康:用数实融合,做一个医生「玩得转」的医疗数据科研平台
数年前,数字医疗的火热,让不少人把目光投向RWD——真实世界数据。
如字面意思,这一概念强调用患者的真实数据做研究,将日常所收集的各种与患者有关的数据,通过常见的数据挖掘等工作释放数据价值,从而将数据再用于医学研究。
如今,已有临床CRO、大数据、人工智能、医生平台、基因检测公司等多种产业角色涌入RWD,相继推出面向医生群体的科研工具。
但长期以来,这一赛道都缺少一个大体量的公司入场。
2022年5月,京东健康宣布正式布局RWS(真实世界研究)业务,启动运营真实世界数据(RWD)平台,开放自身的数据服务与技术能力,供医疗机构、学会、医生、企业等研究者使用。京东健康背后的供应链数据、在线问诊数据等数据、医疗机构伙伴数据,也将全部会在自建的RWD平台上“跑起来”。
在雷峰网 (公众号:雷峰网) 看来,京东健康RWD平台是对既往能力厚积薄发和对行业痛点的敏锐洞察的产品,让繁多的、面向医生的科研工具多了另一种角色。京东健康的C端布局与积累,只是一个开始。京东健康C端服务,与B端服务和H端服务的协同推进,让人看到了这家巨头更多的可能。
真实世界数据,对医疗科研工作者意味着什么?
过去,临床科研项目中的多数据源整合问题,一直都是行业痛点。
中国中医科学院中医临床基础医学研究所等机构,分析国内RWS热点发现,截至2021年9月的十年间,RWS的数据来源主要包括医院信息系统、电子病历、病例注册登记平台、医疗保险数据库、全国人口数据库等,研究热点集中在HIS(医疗信息化)数据的挖掘与分析。
尽管RWD的入局者横跨医院、药企、保险、大数据公司,却大都聚集在院内数据挖掘上,这番景象无异于几家地主同争一亩二分地,入局的壁垒和天花板都很低。
实际上,医生的科研需求,远不止是用好手头仅有的院内数据。对他们来说,由于丢失了患者在院外的数据,无法观察疾病进展的全过程,通常导致现有的医学研究的知识图谱难以支持精确诊断和个体化治疗。雷峰网了解到,不少医院的医生,曾向一些互联网医疗和AI厂商直言:“谁能帮我找回院外的患者,就是一件大好事了。”
为何不去寻找新大陆?问题可能是,厂商们无法做到。
实际上,真实世界研究通常覆盖人群广、样本量大、随访时间久、项目周期长,导致研究实施成本过高。同时,真实世界数据分散,无论是在院内还是院外,都形成了不同程度的信息孤岛。
时间、成本、技术,都是摆在前面的三重风险,不少企业对于这项费力却不一定讨好的事情,望而却步。而这,正是京东健康过去所一直隐而不露的优势——具备全场景用户全生命周期的数据。
据雷峰网了解,此次推出的RWD平台,建立在京东健康业务布局的基础上,覆盖了“防、筛、诊、治、康”的医疗全流程,帮助医生们补齐院外数据这一块拼图。
京东健康RWD平台对多源数据的处理流程
在数据收集上,京东健康RWD平台整合院内外数据,结合患者在京东健康互联网医院的电子病历、科研随访记录、居家设备数据等,形成完整的真实世界数据链条。据京东健康方面表示,数据收集效率达到传统模式的6-7倍,可以极大提升医生开展研究的效率。在这些数据的基础上,京东健康RWD平台基于健康知识图谱,通过开放的、可扩展的数据映射组件与清洗组件,解决数据清洗难题。
在数据处理上,针对个人信息,京东健康基于数据使用和呈现的不同需求,使用数据脱敏系统对敏感数据进行脱敏处理。数据脱敏系统内置了丰富高效的脱敏算法,可根据不同数据特征来快速脱敏常见的敏感数据,如姓名、证件号、患者健康状况等。也可根据自身的数据特征或政策合规、应用系统等需要,自定义脱敏算法自定义算法功能。此外,数据脱敏系统可以有效防止对隐私数据的滥用,防止隐私数据在未经脱敏的情况下从系统流出,从而实现既满足对隐私数据的保护,又满足监管合规的双重需求。
对于科研人员而言,RWD平台是一个SaaS化的产品,可以在这个平台上对患者多源数据进行采集,并对数据进行深度处理和分析,获得医疗产品的使用情况或潜在获益的临床证据。
此外,在医生基于RWD平台的日常科研中,京东还提供了另一大优势:线上随访。依托京东健康互联网医院线上随访能力,包括量表、健康值测评、随访答题激励等多种工具,医生可对患者的疾病进展、治疗情况进行全程跟踪,帮助医生多维度进行患者管理,增强患者的依从性,保持良好的医患关系。
有了这个RWD平台,研究者不仅获得了全方位的科研及临床决策支持,也在SaaS化服务中探索患者管理新模式,提高数据管理效率,降低科研成本。
据雷峰网了解,目前,心血管疾病将成为京东健康RWD平台的首个应用领域。
近期,京东健康联合中国心血管健康联盟发起“中国高血压患者院外规范化管理推广工程”,计划推动一万名心内科医生在《高血压院外互联网管理中国专家共识》的指导下管理、服务超过一百万名患者。
在提升医生工作效率、增进患者自我管理意识的同时,京东健康RWD平台将沉淀随访数据和医患两端的反馈,生成百万量级的结构化院外随访数据,并依托这些数据,分析并产出真实世界下高血压院外管理的研究报告和患者管理白皮书。
而这只是一个开始。未来。京东健康RWD平台将实现与医疗机构、区域医学联盟实现数据互联互通,为更多大型真实世界研究提供解决方案。
用技术,打破多源数据融合的那堵墙
在京东健康RWD平台的背后,一方面源于京东健康敏感的业务拓展嗅觉,另一方面是整个集团层面的技术助力。
京东健康技术产品部互联网医疗高级产品总监袁晓春表示,“RWD的数据挖掘、数据结构化、线上随访能力,都建立在京东健康的已有数智技术集群中。我们认为,现阶段平台的用户管理规模和数据规模达到了一个合理的量级,推出RWD平台的条件已经成熟。”
在袁晓春看来,从一开始,京东健康就是奔着医生们最迫切的院内院外一体化数据需求去的。
其中,获取难度最高的用户随访数据,可以说是所有院外数据中最关键的数据。这一环节,既强调与患者的关联、患者随访的防脱落,又要强调随访数据的真实性等,对缺少与C端用户打交道的公司来说,极易导致用户失访、用户数据不完整或失真。
袁晓春表示,这正是互联网公司更擅长的部分。目前,京东健康所用的工具迭代、随访激励、医疗器械数据自动采集等,更贴合互联网公司的打法和经验。
从随访数据的出发点看,京东健康一直强调的是医生的自我驱动。她表示,“患者也需要医生随访,比如很多慢病患者非常需要线上院外的诊后管理,随访数据则会与患者的健康强相关。医生也不是为了科研而科研,RWD实际是互联网医疗价值的延伸和体现。”
以京东健康随访项目数据来看,一些项目用户的失访率可以控制在30%以内。如果以京东健康年度活跃用户数量1.23亿(京东健康2021年全年财报数据)计算,后续一旦全面开放面向用户端的随访功能,将能够在很大程度上扩展RWD平台的数据体量。
此外,关系RWD平台搭建效果的第二点,是数据融合处理的能力。
作为坐拥海量C端用户的企业,京东健康旗下互联网医院沉淀的诊疗数据、京东大药房积累的用药和随访数据、京东家医从用户健康状态就开始沉淀的医疗健康全维度数据、消费医疗连接的各类检验检测数据,均构建了一个海量的数据池。
为此,京东健康RWD平台会对收集到的多源数据,支持对问卷字段进行单因素分析、相关性分析、生存分析等常见的数据分析;并通过搭载的Flink实时计算引擎,提供千万级规模的实时数据分析,可多维度分析调研内容的相关性;提供多维图表形式,支持分析结果导出,帮助研究者更全面的了解数据情况。
让机器对医疗数据进行清洗和理解,一直是一个让行业头疼的问题。
开发者拿到一个简短的文本后,要去解决实体识别的准确率问题,包括文本纠错、名词短语抽取、NER ( 命名实体识别 ) 和实体链接。最后,则需要结合底层数据的积累,包括知识图谱的建设以及结合具体业务场景的数据来完成语义上的扩充。
例如,患者的就诊记录中会有一些日常语句。比如,患者会说“口腔溃疡”、“口疮”等,而这些字段,在医生那里会有一个专有医学名词——“复发性阿弗他口炎”。因此,对于京东健康来说,就需要建立内部的标准字段集,用机器来对患者的日常用语进行分类和理解。
实际上,在推出RWD平台之前,京东集团层面就已经具备了非常多的数据处理“武器库”,比如隐喻识别、聚类分类、数据的结构化和标准化处理等通用技术。而京东健康多年的技术和知识图谱积累,涉及自然语言处理、聚类分类、通用字段的映射标准等,在医疗大数据的定制化清洗和提取层面,能够达到临床科研级别。
“京东集团的长期的技术能力积累可以给我们更好的支持,我们可以在RWD平台上将集团的技术能力充分复用和发挥。”
值得一提的是,除了集团层面,京东健康内部还有一个技术中台,有一支专业的数据产品和技术团队投入在RWD平台的开发上。
袁晓春透露,无论是人员设置,还是技术建设,最终的目标都是打通院内院外的数据,低成本、规模化、连续地开放给医疗研究人员们使用。
医疗数据价值探索的下半场
回顾京东健康过去的发展路径,我们能发现,过去,京东健康加速从“商品提供者”向“服务提供者”转型,而这也是其走向“数实融合”发展的重要基础。
京东健康的2021年业绩报告显示,其总收入达306.8亿元,同比增长58.3%,其中服务收入同比增长72.7%,占整体收入的14.7%,这一板块的增速和比重均提升明显。
据了解,京东健康的“服务”含义覆盖广泛,除了为C端用户服务,还为广大医疗健康行业的相关参与方,如医院、医生、产业链伙伴等提供各类服务和解决方案,但最终又实现对用户需求的“反哺”。这说明,京东健康的医疗健康服务效应正在逐渐凸显。
实际上,打通全流程健康服务闭环,京东健康早在2017年年底就有所行动。
彼时,京东健康获得国内首批互联网医院牌照,开展在线咨询问诊业务,着手将医生资源平移到互联网医院。另一边,京东健康也在探索医生与用户的服务模式,并在随后重点进行了专科中心、专病库建设、专病字段集等建设,为日后满足多方科研诉求打下地基。
目前,平台已经开设了包括心脏中心、耳鼻喉中心、中医院、呼吸中心、精神心理中心等在内的27个专科中心,外部医生团队覆盖超过1.5万家医院的十余万名医生,并入驻近百位权威专家和顶级名医,如韩德民院士、胡大一教授、高思华教授、林江涛教授等。
因此,基于以往的积累,RWD平台已经规划了心血管、消化内科、耳鼻喉科、妇产、精神心理等12个学科内的约100个专病库,不断开放给多个学科的研究者使用,形成平台与医生的正向循环。
这表明,面向医生端的需求,京东健康打响了平台化建设的第一枪。
比如,2020年起,京东健康推出了基于药学知识图谱的处方审核引擎,这是基于药学知识库和真实世界数据,结合语义理解、机器学习等人工智能技术构建的药学知识图谱,相关产品可以为各方提供高效便捷的合理用药和智能处方审核等服务。
实际上,在长期被信息割裂的医疗行业中,医生和零售药房能够在京东健康的数智化工具帮助下,提供更多样化的患者服务;同时,除了打造自身的全流程健康服务闭环外,京东健康还利用自身的技术基础设施和能力,帮助H端的医疗机构及B端供应商提供智能医疗解决方案。而京东健康也因为有这些业务沉淀出的能力资源和数据服务做底气,在拓展新业务时有更多想象力。
袁晓春表示,一直以来,京东健康非常重视信息安全工作,在“医”、“患”、“药”、“械”等业务领域都做了安全布防。除了满足国家“三法一条例”等法律法规及行业监管政策的要求之外,京东健康也在不断打磨符合健康医疗行业特有规定深度信息安全保障能力。截至目前,京东健康已获得ISO27001和ISO27002认证,同时在此基础上不断提升医疗健康信息安全能力,为用户和合作伙伴提供更好的数据安全服务保障。
回归到创立RWD平台的初衷,袁晓春对雷峰网表示,在京东健康的发展中,越来越多的医生、院士、以及基层医生加入进来,他们看到京东健康布局的链条,也会主动和平台沟通,希望京东健康能够帮助打通院外数据,建立一个公开使用的数据研究平台。
“如今,RWD平台以SaaS形式向外服务,其实是京东健康不断与平台医生规划、设计的结果。在这个过程中,京东健康也在不断向医生的真实需求靠拢。”据袁晓春透露,RWD平台中的随访管理工具已经逐步面向医生全量开放。
针对未来规划,京东健康将会基于每一个专业病种、学科,推出更深层次的管理工具和数据能力。“这将是未来一段时间里我们的重点工作。”
基于全产业链的医药能力和全周期健康管理能力,京东健康正在不断拓展和匹配更贴近用户需求的健康管理服务。对京东健康来说,在探索数据价值的下半场,以RWD平台满足医生的长期职业发展需要,将是个新使命与新机会。同时,基于京东健康在C端服务的技术积累,在与H端的协同创新中,也让人感受到了可期的未来。
“我们在智能辅诊和数字疗法方面也会持续发力,目前正在快速迭代更加数智化的解决方案,所以,京东健康接下来也不断会有全新的医院服务产品推出。”袁晓春说。
雷峰网原创文章,未经授权禁止转载。详情见。