大数据成提升医疗服务精准性关键,机器学习助力医疗健康行业转型
随着计算机系统可以从 大数据 生成洞见并支持决策, 机器学习 正在改变 医疗健康 行业的方方面面。从这个意义上来讲,使计算机通过学习,赋予新功能可以说是“塑造未来”,这不亚于人类教育。出乎意料的是,“教育”计算机系统其实是一个劳动密集型过程,这不仅需要大量的数据,还需要细致了解来自每个数据源的每个数据元素,以及多年的反复试验、不断试错和深厚的专业知识。机器学习的关键不同之处,并不是具体的技术和科学应用,而是在此过程共所需的“教学材料”的量和质,以及“教师”的知识面。
机器学习需要人的参与及专业知识
如今,计算机渗透到人类生活的各个行业,这些计算机可以从经验中学习,进而具备新功能,处理新情况。除了网络搜索、垃圾邮件过滤、音乐推荐等日常功能,计算机也在通过每一次人机交互变得越来越智能。
机器学习将加快医疗健康行业转型的步伐,这是因为它能够支持我们从海量的数据中生成洞见。越来越多的证据显示,机器学习能够支持药物研发、识别风险人群、提高诊断、提供研发设计支持、优化销售和市场营销等。
1、高质量的数据
解决医疗健康业务问题,有时需要有广度的数据,有时需要有深度的数据。但是大多数情况下,尤其是对于关键业务决策,数据必须是高质量的,“干净”的。这也就是为什么大多数声称自己可以在“脏数据”上面工作的数据挖掘机构,在处理数据之前实际上有一个针对“脏数据”的集中清洗步骤。在这里也有必要回顾一下数据清洗和处理中的三个基本步骤:桥接、编码和链接。这些步骤不仅可以产生高质量数据,也是在处理和分析阶段,高质量机器学习的基础。
案例
机器学习正在实时地改变医疗健康行业。IQVIA建立了一个决策支持系统,使用机器学习来帮助药企管理临床试验中的医生选定,这也是试验成功的基础。
治疗领域的专家构建了多维模型,阐述研究方案的所有细节。多名不同专长的数据科学家组成团队,构建匹配的多维模型,以描述所有医生开具处方或诊疗的模式和历史。通过深度学习,我们训练了一个基于8PB数据的系统,数据涵盖了可追溯(桥接、编码和链接后)的医疗报销和电子医疗病历(EMR)数据,最后按照成功几率排列调查人员的优先顺序。这使得未注册的调查人员的百分比下降了两位数,同时,参与类风湿关节炎研究的患者注册人数百分比也增长了两位数。
因为医生的行为和研究内容非常复杂,所以领域专家有责任了解如何针对这种复杂性进行建模。建模结果的准确性取决于训练过程,又直接受数据质量的影响。
机器学习的关键基础就在于用于训练模型的高质量数据的有效性,以及负责优化结果的行业专家的持续监督。
2、人类的持续介入
即便机器学习系统已经成熟,过去的60年里,机器每年都成功地处理了数十亿或数万亿的业务;但是,日常的人工介入仍然是数据运营和数据挖掘的关键。行业专家必须与机器一同工作,监督并纠正机器工作。
3、机器学习+数据+领域知识
干净的、有关联的和属性丰富的大数据是高质量和有效分析的基础。每一个利益相关方(制药公司、支付方、供货商等)和每一个衡量维度(国家、语言、供应商、数据类型),以及每一个特定的用途(治疗、临床、商业、研发等),都需要特定的机器学习算法和配置。只有通过长期积累,持续建设不断扩大知识储备,才能逐渐开发出有效的分析。
分析被分为三类:描述性、预测性和规范性。
在预测性和规范性分析中,第一个阶段是建模,首先是临床医生和数据科学家在内的专家团队,对潜在问题及可用数据进行分析,并选择能够获得最高成功率的机器学习算法。在这个过程中,人的作用是不可或缺的,需要大量临床实践、数据、计算机科学和机器学习算法,以及区域化的医疗和应用的专家意见。从这个意义上讲,计算机系统(机器)才能依照正确的“指令”去学习。
由于数据和医疗健康行业发展日新月异,机器学习需要不断地改进核心算法和设置。只有对数据科学和医疗了如指掌的专家团队,才能知道何时,以及如何改进模型。尽管与机器的日常交互和专家的定期监督是资源密集型,且费时费力,但这对计算机系统的性能提升是至关重要的。
结论
医疗健康行业每年都能产生数以亿计的记录数据。我们得到的数据越多, 医疗服务 就变得越加精准。同时,这些数据也带来了成千上万的分析类问题,如果具备高质量的大数据,前沿的科技,以及丰富的专业知识,机器学习可以在解决问题方面产生深远的影响。
机器学习的各个步骤都要求专业人员对所研究课题有深入广泛的知识。从这个角度来看,机器学习是一个需要人类深度参与的过程。
2018年3月23日,亿欧将在广州举办
GIIS 2018第三届医药未来领袖峰会
,就跨界玩家、创新药研发、产业基金、CRO、两票制、处方外流、医院和药店管理运营等热门话题,携手业界大咖进行交流分享,以期在认知层和方法论给行业带来新思考、新启发。