IBM Watson Health大中华区主管吴一多:帮医生找到最适合的治疗方案
2017年7月9日,由浙江省人民政府指导,杭州市人民政府主办,ACM(美国计算机协会)、IEEE(美国电气和电子工程师协会)、中国 人工智能 学会、浙江省委人才办公室、浙江省科技厅协办的“未来已来”全球人工智能高峰论坛在浙江杭州未来科技城拉开帷幕。亿欧作为支持媒体参与了本次报道。
IBM Watson Health 大中华区主管 吴一多 先生发表了《IBM Watson Health》重要讲话。
各位下午好!
我在国内好多城市讲过Watson Health,但是这是我第一次在我自己的家,我是杭州人,第一次在杭州讲,今天真的非常高兴。
我们现在处在变化非常快速的时代,远远不止这四家公司,有非常多的公司创新我们把它叫做“破坏式创新”或者是“颠覆式创新”,这些公司都有一些特点,比如说阿里巴巴没有自己的仓库等等,这些企业其实都在他们所在的行业里颠覆了原来的规则。
我们回到 医疗 ,这个颠覆今天有没有发生?有非常多的互联网医疗,比如说解决了挂号的问题、解决了一系列的原来存在的一些问题。但是有没有颠覆性的技术出来?好像还没有。为什么?因为医疗是一个知识工作者密集的地方,像金融、医疗、法律等等,在这样的行业中有几个特点:
第一,比如说一个人的一生或者一个病人某一段病程所产生的数据,不管是连续的或者是片段的,数据非常多,这个和做一个单一的交易不一样,而这些数据的前后都会发生关联。
第二,为什么说它是一个知识工作者的一个密集领域? 医生、律师需要非常长时间的训练、学习,一个肿瘤医生从开始学专业知识开始,到成为一个合格的肿瘤医生,大概20年有,所以在这样的行业中,我们互联网做到了大家获得信息的平等,非常快捷、低成本的获得信息,移动互联更使我们在不同的地方更便捷的获取这些信息。但是在医疗这个行业中,仅仅做到信息的透明和公平还不够。在1950年左右的时候,所有的医疗知识翻一倍是50年的样子,大概是2015年,所有医疗知识翻一倍大概是3年,预计到2025年可能缩短到几个月,也就是说我们人类在产生某一个领域的知识的速度在不断地加快。
因此,我们现在面临的类似于医疗这样的领域,我们的传统技术能够接触到或者能够处理的部分在蓝色部分。也就是我们通常说的“结构化的数据”。但是在这样的行业中,我们的知识在哪里?人类产生知识的载体是什么?是自然语言,不管在期刊、书、论文等等,载体不是结构化的数据。在这个基础之上会有更多的图片、视频、物联网传感器产生海量的流失数据,这些类似于医疗这样的行业中,我们都缺乏处理的能力。
还是回到知识,今天我们如果要获取某一个知识点的话,我们通常怎么做?不管用谷歌、百度,我们可能会输入我们设计好的几个关键字,这些搜索引擎已经能够非常快速并且相对透明的把我们要的知识给我们、信息给我们,但是我们拿到的是什么?我们拿到的是和我们关键字相关的文章,我们能不能直接总搜索结果中得到我们所要的知识的答案?可能还不行,我们接下来要阅读这些文章,才能够知道这些文章里面的观点,所以我们要进一步处理这些TEXT,处理这些视频、音频,不是内容管理,还不够,我们需要当我们有问题在某一个领域中要得到答案的时候,我们希望有一个助手直接告诉我现在有哪些可能的答案,逻辑是什么,依据是什么,这是2005年的时候IBM研究院提出的设想,要做深蓝之后的新一代的人工智能Watson。
提出几个要求:
第一,环境、知识是没有边界的。
第二,和用户的互动、沟通是自然语言的。
第三,要有能力能够处理开放式的问题, 就是某一个问题不是有标准答案的,要有若干不同的观点,不管是围棋、国际象棋规则、边界非常明确,但是真正商用化的环境中这一点很难做到。
我们把1000多个视频给Watson,Watson读了1000多个视频以后在右边把若干个视频中相关的概念和主题总结出来了,这个不是关键字,在这样的基础上,我们问他一个典型的问题,这个问题是“金钱和幸福的关系是什么?”这是人类世界里的典型的开放式问题,不同的价值观下有不同的答案,很像癌症治疗的时候,可能没有一个办法对于某一个病人怎样的治疗方案就是标准答案,没有的。这是Watson给我们的答案。
下面的色块不是一个一个的视频,是Watson从1000多个视频中找到若干个不同的观点,而这个观点的背后是这个视频里关于这一段的描述,它把它编辑成一个视频。 也就是说Watson的处理不仅仅是对内容的关键字或者是对字面的理解,理解的是字面下的含义和主张。
回到认知,认知从词面上来理解,它谈论的是意识和精神层面的活动,所以如果要做一个认知计算系统的话必须要能够学习、能够创建知识、要能够理解自然语言。 这是Watson的核心能力,今天的场合可能不是一个技术的专题,在这儿只是提几个核心的点,Watson将识别知识题里海量的Entities,以及Entities之间的关系,通过建立知识的本体,然后用解释器解释每一个Entities。比如说Watson并不是把这一段文字中的名词拿出来,要理解ERK2(蛋白)、磷酸化是一个动作,连接每两个Entities之间的关系,要理解语法驱动下的结果。比如说癌症治疗中要知道哪些是疾病、哪些是症状、哪些是药物、哪些是对于描述的Modifiers, 这是Watson的一个能力,要深层次的理解自然语言,通过自然语言得到知识图谱。
当Watson回答一个问题的时候(开放式问题),我们也可以问一个相对有一定正确答案的问题,比如说“中国的首都是哪一个?”Watson得到这样一个问题的时候首先会解析这样的问题,你问我到底是一个人、一个城市、一个地方、一本书还是什么?它知道你现在问我的是一个城市,他会在知识体内把所有认知的城市都拿出来,拿到城市以后寻找证据,这些证据有一些是支持这个城市是中国的首都,有一些是反对这个城市是中国首都,所以在城市列表中,每一个城市得分不一样,在几百个价值维度上对假设做评估。
不同的证据、不同的文章、不同的片段作为证据的价值是不一样的,Watson是通过了大量的题目的训练来得出要怎样对每一个问题,在某一个场景下怎样来支持或者反对这个结论,而这个过程就是机器学习的过程。
Watson在2011年赢了比赛以后,第一个找我们的就是医疗单位,其中一个就是MSK,它是全美排名前三的癌症中心,找到我们的时候非常想知道,Watson在回答问题的时候能不能用这个知识帮助癌症医生通过特定病人找到几千万文献给出最适合这个病人的治疗方案。2011年Watson Health和MSK团队一起研发,去年8月份的时候,中国第一个可以提供watson for oncology的合作伙伴就在杭州,今天杭州浙江省中医院可以用watson for oncology。
事实上watson for oncology对质量方案的推荐,和医生面对一个病人的整个流程非常接近,也会参考NCCN的大纲,也会在十几秒时间内过滤1000多万文献来评估不同的治疗方案对于这个特定的病人的影响,因为不光是癌症本身,比如说肺癌可能有肝转移、脑转移,每一个病人机体状态不一样,不同药物有不同的不良反应、有不同的针对性,有上千万的期刊在不同场景下做了这样的参考,但是医生是非常难对每一篇期刊都能够阅读并且记忆。
因为从容量来说,如果我们的大脑容量从体积比例来说是一个鞋子的盒子的话,今天的Watson存储能量大概是8个冰箱那么大,所以在刚才所说到的知识飞速发展的现在,我们人需要一个外部的助手帮助我们记忆、处理知识,提供答案给我们。 而watson for oncology提供的不仅仅是一个答案,不仅仅是个化疗方案,同时告诉医生我为什么对这个病人推荐这个治疗方案,并且这个结论下支撑我的证据是什么?是哪些临床报告结果支持了这个治疗方案的决策。所以watson for oncology会成为医生的助手,不会替代医生。 但是未来的医生用这样的工具或者不用这样的工具会有差别,而watson for oncology只是肿瘤套件中的第一个,未来会有更多的肿瘤套件来到中国。
而肿瘤学的套件在整个Watson Health架构中也是其中的一方面,而且在watson for oncology的支持上,会提供API、提供开发环境等等,非常希望梦想小镇的创业者和IBM一起在这个领域中有所创新,谢谢!
2017 年 8 月 25 日 , 亿欧将举办 “ 破壁 · 融合 亿欧 2017 中国大健康产业升级峰会 ” 。本次峰会将重点关注大健康产业升级、行业变革与创新。活动三大亮点 :1 、卫计委相关领导将在会上发起成立 “ 大健康产业联盟 ”,2 、亿欧智库将发布《 AI+ 医疗行业报告》 ,3 、 “ 大健康产业领军 50 人 ” 专题片震撼首发 ! 行业变革势不可挡 , 产业创新方兴未艾。欢迎您报名参会 , 峰会链接 : http://www.iyiou.com/a/djk_beijing_2017