IBM的野心:重金压宝AI医疗,到底是对是错?
Paul Tang正在医院里陪伴他刚做完膝关节置换手术的妻子。每年,全美都有约70万人做这项手术。Tang自己也是一名初级保健医师,他问医生,根据他以往的经验,他的妻子何时能恢复正常生活。但医生始终模糊其词,无法给出一个明确的答案。“我终于清楚地意识到:他自己也不知道。”Tang很快明白,大多数医师其实并不知道患者什么时候能康复、恢复正常生活,而这对于患者来说是最重要的事情。
Tang依然会以医师的角度看待患者, 但他同时也是IBM的Watson Health的首席卫生改革官。Watson Health是Watson旗下的一个商业集团,专门研发卫生保健应用,也就是IBM非常看重的机器学习系统。Tang指出,Watson可以传达医师都不知道的信息。例如它可以告诉医生患者要多久能康复,帮助医生分信息图像和组织样本,决定适合患者的最佳治疗方案。
正是这些技术的无限可能使得卫生保健成为了机器学习技术的最炙手可热的应用领域。据市场研究公司CB Insights调查,从2013年至今,起码有106家创业公司进军了该领域,且生存至今。
但这些创业公司没有任何一家具有Watson级别的知名度。这要归功于它在2011年智力竞赛节目《Jeopardy!》的胜利和之后IBM之后的营销够给力。但最近,有关Watson的新闻报道主要都是负面的。之前高调宣传的与MD安德森癌症中心的合作也于今年告终了。随着IBM的收入缩水、股价下降,分析师纷纷质疑Watson是否能够实现先前宣传的价值。
“Watson就是个笑话。”风投公司Social Capital的创始人之一,注明技术投资人Chamath Palihapitiya今年五月在CNBC上说道。
然而,这一系列的批评指责似乎无一是以Watson的科技缺陷为根据的,大部分针对的都是IBM对Watson的实现目标所需的时间预计太过乐观。事实上,目前看来, AI在卫生保健领域的应用今后还将会由Watson Health领导。如果Watson目前看来进行的真的不顺利,那么主要原因之一就是它还需要“培训”某个种类的数据。而且整个行业碰到这个问题的不仅仅是Watson一家,事实上这是该领域所有公司共同面临的难题。
AI是否会在未来五年中改革医学领域?
虽然数据缺失可能会放慢Watson的步伐,但IBM的竞争对手们收到的负面影响肯定还要大。这是因为想要获取数据,最关键的就是大型健康保健组织之间要联手合作;但这些大公司通常在科技方面都非常保守。
有一点,IBM比一众创业公司、甚至Apple和Google重量级竞争对手做的都要好,那就是获取大型组织的高管和IT负责人的新人。相比起来,MD安德森项目的问题都不重要,因为IBM掌握了关键优势。IBM成功把Watson安置在了大量的医疗中心、医疗保健管理团队和生命科技公司中,他们都可以为Watson提供至关重要的数据,帮助Watson在医学领域打造AI的未来。
不现实的时间线
与MD安德森的决裂就是IBM被自己对Watson的炒作噎死的故事。
IBM和MD安德森癌症的合作关系始于2012年。Watson的目标是要读取任何一位患者的症状、基因序列和病理报告,结合医师的备注和相关论文,帮助医生进行诊断和治疗。但IBM和MD安德森双方对这种科技都期望过高。
IBM早在2013年就宣布:“计算的新时代已经来临”,给《福布斯》留下了Watson“已经进入临床试验阶段”、几个月后就能用于真人患者的错误印象。2015年,《华盛顿邮报》引用了IBM Waston的话:“Waston正在打造介于机器和人类之间的集体智慧模型。”《华盛顿邮报》还说电脑系统正在“跟随医生训练医生做不到的事情。”
今年2月,经营MD安德森项目的德州大学宣布该项目已终止。4年来该项目没能生产出一套可以投入实用的工具。MD安德森拒绝针对Watson一事给出评论,但似乎该问题主要是由于项目运营和筹资等环节出现了内部矛盾。不过IBM和Watson之间其实也有矛盾,而且比众人所描述的要严重。
想要知道究竟是什么拖慢了项目的进程,首先你要明白像Watson这样的机器学习系统是如何训练成的。Watson通过不断重新组装其内在的处理程序来“学习”,从而对问题产生几率最高、最有可能的正确答案和方案,例如通过辐射成像诊断癌症。而Watson给出的答案只有可能是人类已知的病症,这样才有人能确定Watson的答案究竟是对还是错。系统收到的训练越多,它的正确率就越高。
训练系统通过X光影像诊断恶性肿瘤还是相对容易的。但对于超越人类已有知识的突破性的难题,例如判断基因变异和疾病之间的关系,Watson就会遇到鸡生蛋还是蛋生鸡的问题:既然没有专家给出且经过整理的已有解答,人类该如何用数据训练系统?
“如果你是在训练自动驾驶车,那么任何人都可以标记树或是路标,让系统学习辨识它们。但在医学的某个专业领域,想要正确地标记信息并教授给电脑系统,你必须是一个经过几十年训练的专家。”纽约纪念斯隆-凯特琳癌症中心的计算病理学家Thomas Fuchs说道。
类似的困难出现在每个IBM希望Watson可以做出贡献的领域,就像任何其他机器学习解决方案一样。想要让Watson吸收大量的数据、并为某位患者找出有用信息,那就必须有人先亲手演示上千遍。想诊断导致疾病的基因,Watson就需要上千条患有该病症且携带这种DNA的患者信息。但患者的基因和病历有时并没有被有效地联系起来,或者数据可能分散在几十个不同的系统中,难以利用。
举个例子,假设我们的目标是要为临床医生提供更好的数据,改善初级保健。如果医生在初级保健诊治阶段错过了患者的小病症,那么患者的病情就会恶化,下一步就要去急诊室或是找专家就诊,看病成本也会上升不少。很多人认为机器学习或许可以改善这种现象。
但想要帮助医生更好地诊断患者,Watson必须找到患者病历和Tang所谓的“身体健康的所有社会决定因素”之间的联系。所谓社会决定因素包括患者是否吸毒、饮食不当、呼吸的空气质量如何等等。但Tang承认,目前为止,几乎没有一家医院或医学诊断会向大量患者搜集这些数据信息。导致该问题的理由之一是医院引进现代化的、数据驱动式操作实在太慢。“医疗保健行业对于新科技的接纳是非常迟钝的。”克利夫兰诊所的医疗保健信息学专家Manish Kohli指出。
当数据缺失时,IBM的处理方式是去买数据。IBM曾从Truven健康分析公司、Explorys和Phytel等公司购买数据,这些公司在处理医院和患者数据方面有着丰富的经验。即便是在MD安德森项目终止后,IBM依然掌握着一些关键性的合作关系,可以为公司提供更多患者数据。
Atrius Health就是其中之一。Atrius Health 是结合了约900名波士顿地区的初级保健医师的大型医疗网络。IBM和Atrius Health的合作关系旨在开发并测试Watson驱动的系统,该系统可以从大量教科书、记录和论文中找到针对患者的有用信息。Atrius的首席医疗官Joe Kimura 表示:“对于初级保健医师而言,浏览海量的相关信息是一项繁重又枯燥的工作。”他还指出,电子病历档案使得情况变得更加糟糕,因为这种系统的诞生增加了每位患者来诊的数据量,又没有可以遵照的标准检索格式。
这种现状的根本原因就是患者病历上的重要备注绝大部分都是IT系统无法理解的句子。但Watson则可以通过当初为了参加《Jeopardy!》开发出的自然语言处理技术理解句子的意思。理想情况下,Watson可以为医生提议治疗方案,为患者选择更为廉价的治疗方案。
“打个比方来说,为什么我们只致力于为受伤的患者提供最好的治疗?我们什么时候能预测患者可能会摔跤,在事情发生前就防止他们摔伤呢?我们要推动医疗行业往这方面进步。”Kimura说道。
MD安德森癌症中心的白血病治疗医生Courtney DiNardo正在用IBM的Watson系统为患者诊治。该照片摄于2013年。
IBM于2015年宣布,由于有Merge Healthcare提供的大量数据,Watson的诊断能力将会有一个飞跃。医学成像及临床系统供应商Merge Healthcare于2015年被IBM以100亿美金的高价收购。
Watson Health还与Central New York Care Collaborative建立了合作关系。Central New York Care Collaborative是一家政府资助机构,与6个国家的卫生保健供应商都有关系。该合作关系旨在为急诊和再度入院的患者减少25%的开支,而且还可能为Watson Health提供大量的患者数据。
不过获取数据有很多种方法。Google的一家兄弟公司就打算直接向患者直接获取数据。Alphabet医疗保健部门Verily Life Sciences正在和杜克大学以及斯坦福大学合作,着手打造完善的医疗保健数据库。该数据库不仅有患者来诊的临床记录,还有健康追踪设备提供的信息。这可以为数据存取带来一大飞跃,虽然想要真正派上用场可能还需要十年,或者更久。
MD安德森和Watson的合作项目虽然没能善终,但和Watson项目同期开始的另一个大型项目现在还在继续。该项目旨在收集每一位来诊患者的数据,其种类总共有1700多种。该项目负责人Andy Futreal指出,患者数据与研究数据的而结合对于Watson这类的系统的能力提升至关重要。“一旦我们有了数据,我们就能进入下一步:训练AI系统判断谁适合不同的治疗方案。”
IBM则选择通过合作方获取数据。仅癌症诊断和治疗,IBM的合作方就有纪念斯隆-凯特琳癌症中心,梅奥医学中心(Mayo Clinic),哈佛-MIT博德研究所以及医疗测试巨头Quest Diagnostics。纪念斯隆-凯特琳癌症中心和其合作方现已开始将论文文献应用到治疗方案决策中,例如佛罗里达的丘比特医疗中心和位于印度的连锁医院。在医药研发方面,Watson Health在与巴罗神经学研究所合作。Watson帮助巴罗神经学研究所寻找导致ALS的五种基因,在此前从未有人把它们与ALS病症联系起来。在安大略脑研所的协助下,Watson已经确定了21种可能有效的治疗药物。
Watson真的能完成医疗行业改革,改善医疗诊断和降低成本吗?私人风投机构Bessemer Venture Partners合伙人 Stephen Kraus表示:“这一定会发生。这不是为了上抬股价而吹嘘的噱头。”但对于IBM不切实际的时间规划,Kraus的看法和其他专家是一致的:“要在这么短的时间内实现确实非常困难。目前阶段这技术还是无法实现的,未来五年里也依然不太可能,而且人工智能是无法取代医生的。”