人类再一次输给人工智能！这一次是预测心脏病

亿欧网 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

人类医生在心脏病发病风险的预测上也失守了！

上周五，《科学》杂志报道了英国诺丁汉大学流行病学家Stephen Weng博士团队发表在《PLOS ONE》上的重要研究成果， Weng博士团队将机器学习算法应用于电子病历的常规数据分析 ， 发现与当前的心脏病预测方法相比，机器学习算法不仅可以更准确地预测心脏病发病风险，还可以降低假阳性患者数量。 人工智能再一次战胜人类。

Stephen Weng博士“这项研究的重要性再怎么强调都不过分”，没有参与这项研究的斯坦福大学血管外科医生Elsie Ross博士在接受《科学》杂志采访时表示， “我真的希望医生敞开胸怀拥抱人工智能，利用这个工具更好地帮助患者。”

我相信大部分心血管医生对人工智能的期待与Ross博士一样。因为据世界卫生组织统计，在2012年，全球非传染病导致的死亡人数为3800万，其中心血管疾病（心脏病和中风等）为1750万人，占所有非传染疾病导致死亡病例的46.2%；而让人感到畏惧的癌症导致的死亡为820万，占所有非传染疾病导致死亡病例的21.7%。 心血管疾病的预防与治疗确实刻不容缓。

实际上科学家也一直在努力寻找与心脑血管疾病相关的风险因子，以达到预防疾病的目的。 例如美国心脏病学院与美国心脏病协会（American College of Cardiology/American Heart Association；ACC/AHA）等机构通过多年的研究，将高血压、胆固醇、年龄、吸烟和糖尿病等一系列因素列为与心血管疾病风险高相关的因素，并推出了ACC/AHA预测模型。 除此之外，还有其他组织机构推出的QRISK2、Framingham和Reynolds等预测模型。

ACC/AHA的预测主要风险因子组合。然而，在Weng博士看来，这些方法都不给力。因为所有标准的心血管病风险评估模型都有一个隐含的假设，即每个风险因子与心血管疾病之间的关系都是线性的，这些模型可能过度简化了它们之间的关系。

相对于复杂的生命活动，这显然太简单了，无法揭示患者服用的药物，或其他疾病和生活方式因素对疾病的影响。甚至还有一些因素是反直觉的，很多人认为脂肪对身体有害，会增加健康人患心血管疾病的风险。但在一些情况下，它实际上是保护心脏的。 “这些例外在人体内实实在在地发生，”Weng博士说，“计算科学给了我们探索那些复杂关系的机会。”

为了探索利用机器学习预测心血管病发病风险的方法，Weng博士团队从Clinical Practice Research Datalink（CPRD）数据库筛选了378256名符合标准居民的10年（2005年1月1日起）电子病历，这些居民在2005年都是各方面指标正常的健康人。

然后随机将这个庞大的数据库分成两份，其中295267（78%）个居民的电子病历，用来训练机器学习算法，剩下的82989个居民的10年电子病历用来验证算法的准确性。 据Weng博士了解，这是全世界范围内，首次在如此大规模的群体中，使用机器学习预测人类患心血管疾病的风险。

为了找到更合适的机器学习算法，Weng博士和其同事采用了4种机器学习算法，它们分别是： 随机森林（random forest）、逻辑回归（logistic regression）、梯度提升（gradient boosting）和神经网络（neural networks）。 将ACC/AHA模型作为对照。

第一步工作是让4种机器学习算法在没有人类指示的情况下，通过分析295267的电子病历数据，各自“创造”一个预测模型。 当研究人员将标准化的数据“喂”给这四种算法之后，它们很快找到了各自认为的与心血管病发生相关性较高的风险因子。

在这一步，机器学习算法就显现出了它的优势。 与ACC/AHA指南相比，年龄、性别和吸烟三项风险因素，也被四种机器学习算法列为首要风险因素。 然而，现行的许多心血管疾病算法认为糖尿病是风险因子之一，四种机器学习模型要么不考虑这项因素，要么只认为糖化血红蛋白是风险因素。

四种机器学习算法自己“摸索”出来的重要风险因子更有意思的是，这四种机器学习模型认为房颤、种族差异、慢性肾病、慢性阻塞性肺疾病和严重精神病等疾病，以及是否服用皮质类固醇，以及甘油三酯水平等生物标志物等是重要风险因素。但是这些在现存的模型里都是不存在的。

这再一次表明，机器学习可以帮助研究人员发现一些潜在的风险因子，这些变量凭人力是很难发现的，但是机器学习可以从其他变量中推断出来。 那机器学习的这几套模型到底靠谱吗？

第二步，Weng博士将四种机器学习算法自主建立的模型与ACC/AHA模型进行比较，让它们分别预测剩下的82989个居民哪些10年后会患心血管疾病 （实际总发病人数为7404人，当然研究人员没有把这个信息告诉深度学习模型），哪些不会发病。

不难看出，四种机器算法自主创建的模型要优于ACC/AHA模型。 随机森林模型的敏感性比ACC/AHA高出2.6%，逻辑回归模型的敏感性比ACC/AHA高出4.4%，梯度提升机和神经网络模型的敏感性比ACC/AHA高出4.8%。从本研究的结果看来，最好的神经网络算法比传统模型多正确预测了355个居民的发病风险。 这意味着，在更大的人群里，将有数以万计的人会因此而得救。

然而，我们也不难发现，即使引入机器学习算法之后，还有30%以上的高风险居民没有被提前预测出来。这意味着深度学习算法还需要大幅改进。 Weng希望在将来能将更多的生活因素和遗传因素纳入分析范围，进而提升其精确度。

这件事情却未必那么容易。 因为机器学习算法就像“黑箱”，你输入数据，它反馈结果，然而在这个黑箱之中到底发生了什么，目前研究人员是很难知道的， 这使得科学家难以在算法上做调整。不过，科学家正在努力改进这一现状，争取实现数据处理过程的可视化。

相较于人工智能在常规电子病历上的应用而言，人工智能在影像学领域的科研和应用正可谓如日中天。 尤其是2015年底，Google和Facebook先后公开自家的深度学习算法TensorFlow和Big Sur，带动了基于图像识别的深度学习算法在医疗领域的爆发式发展。

基于图片识别的人工智能目前在皮肤癌、糖尿病视网膜病变和先天性白内障等疾病的辅助诊断上已经达到或超过专业医生的水准。 今年年初FDA批准了全球首个深度学习影像临床应用平台Arterys Cardio DL，意味着深度学习技术正逐渐获得认可。

目前国内同行也在积极布局人工智能在医疗领域的应用，例如致力于医疗影像的智能诊断和大数据分析的慧影医疗，在今年3月底联合七喜医疗发布了全球首款智能DR。

而致力于在眼底、X-Ray和头颈癌MRI等各个科室影像的诊断与科研的肽积木，首创将深度网络应用于病灶识别标记及病程判断，可在13~15秒内完成一张病灶标记，远快于3~5分钟的行业标准，实际场景已超过医生准确率，在特定数据集准确度超过97%。 从眼底照片的阅读与识别入手，肽积木在糖尿病视网膜病的等级识别方面已持平国际顶级医生。

尽管国内处于辅助诊断阶段的人工智能平台，在准确度上也已经达到或超过医生的水平，但是在政策、技术、伦理，以及教育方面仍有不少问题需要突破。不过， 2017年3月，人工智能首次被列入政府工作报告中。国家将加大在人工智能领域的投入，在未来的5-10年，这个产业或许会发生很大的变化。

2017年5月12日，亿欧将举办“ 2017中国医药产业未来领袖峰会 ”。本次峰会将重点关注 医药健康产业变革与创新、创业与投资。 行业变革势不可挡，产业创新方兴未艾 。欢迎您报名参会，峰会链接： http://www.iyiou.com/post/ad/id/205

人类再一次输给人工智能！这一次是预测心脏病