腾讯首次详解“觅影”产品:AI医学影像技术如何应用于肿瘤早筛?
今年8月份,腾讯发布了AI医学影像产品“腾讯觅影”,利用人工智能医学影像技术辅助医生实现早期食管癌筛查,凭借“觅影”腾讯正式进军医疗人工智能,加上早前的“百度医疗大脑”、阿里“ET医疗大脑”,BAT已经全部入局医疗人工智能。
觅影产品一面世便得到广泛关注,今年九月份,马化腾在清华大学演讲时也提及“觅影”,“我们最近在医疗方面也推出了一个产品叫腾讯觅影,就是用人工智能处理医学影像,比如对食道癌进行早期筛查,还有肺的切片、乳腺癌,还有很多需要医学影像分析的领域,和医院专家进行合作。通过深度算法,相信AI未来在医疗领域还是可以起到非常大的作用。”
目前国内医疗AI创业公司也多以影像识别为主,据钛媒体TMTbase数据库统计,AI医学影像的创业公司多达几十家,医学影像识别成为医疗AI领域里较为成熟的垂直细分领域。
元璟资本合伙人田敏认为医学影像成为“一枝独秀”的原因在于,“影像数据获取相对容易,三甲医院设备都是GPS设备、全球顶尖设备。原始数据是电子化的,对于初创公司来说,一个是图像的质量,一个是电子化获取程度,都相对容易。”
因此,利用AI医学影像技术实现弯道超车成为后来者的选择,“我们能不能利用人工智能和图像识别的技术来辅助基层的医院提高他们的医技,能不能利用这样的技术手段提高三甲医院医生的工作效率,腾讯觅影就是干这个事情的。”在9月22日举办的“国际医疗人工智能大会”上,来自腾讯互联网+部门、负责腾讯“觅影”产品应用和推广的吴明柱对腾讯觅影进行了详解。
腾讯目前在医疗领域有三个方面的积累:用户服务、数据能力、资源整合。而医疗AI以及影像识别是在学术科研上的应用,此外,在用户服务上,腾讯也涉及了预约挂号、在线问诊等业务。
以下是吴明柱关于“腾讯觅影”的分享,钛媒体编辑略有删减:
今年2月份国家癌症中心发布数据,中国新增的癌症人数是480多万人,死亡是290多万。在中国的癌症发病率跟全球的平均水平差不多,但是死亡率远远高于全球的平均水平,尤其高于欧美发达国家水平。
其中很重要的原因是什么?
我们的癌症发现期比较晚,发现基本上就是晚期了,晚期它的治愈难度非常大,拿肺癌来说,肺癌在早期的治愈率能达到70%到80%,但是晚期肺癌五年存活率只有15.1%。对于癌症的早检查,早发现,早干预,是非常重要,这个在医疗当中就是早筛。
目前对于癌症早筛用的最主要的手段就是医疗影像,也就是俗话说的拍片子。但是从早筛来讲,它一方面产生片子的数量非常多,但是靠人工看还是费时费力。另外一块来讲中国地大物博,但是医疗资源相对来说比较短缺,另外优质的医疗资源不是特别均衡。
所以对于一些欠发达地区它对于早期癌症筛查的要求还是非常高的,在欠发达地区也很难做到。我们能不能利用人工智能和图像识别的技术来辅助基层的医院提高他们的医技,能不能利用这样的技术手段提高三甲医院医生的工作效率,腾讯觅影就是干这个事情的。
人才和技术积累
腾讯觅影整合了腾讯内部几个顶尖的AI的团队,包括我们的互联网+部门,包括腾讯的腾讯优图实验室和架构平台部,可以说是汇集了腾讯最精英的人工智能技术团队。
从觅影产品的后端来看,是有一个AI医学实验室,在这个医学实验室里面除了有这些顶级的人工智能算法专家之外,我们也请了全国顶级的一些医疗影像科的医生和很多的全科医生,同时也会跟很多的医疗机构和医学院校以及各个地方政府共同去合作,来打造我们的觅影产品。
和腾讯在AI医学实验室当中,差不多有将近五十名AI科学家,也都是在博士以上的水平,也有400多个AI开发工程师,从团队上来讲像腾讯的AIlab,在全球最大的计算机围棋大赛当中11连胜,获得冠军,但是比较遗憾的是阿尔法狗没有参加,如果参加不知道怎样的结果。腾讯的腾讯优图专注于图像的识别,在人脸这块也刷新多项世界记录,我们的架构平台部一直以来也是在腾讯内部处理着腾讯内部的文件。
觅影产品今年8月份发布,但是腾讯在人工智能这块的积累是比较长期的。目前来看,腾讯每天处理图片的数据15亿,非常庞大的数据。
像QQ空间,像人脸识别,这个工作腾讯做了很多年。从技术上来讲,我们的AILAB几个月的时间,在今年数字经济峰会上,小马哥(钛媒体注:马化腾)也说未来的互联网就是在云端用人工智能去处理大数据,所以说腾讯在人工智能上面的方向应该是坚定不移的。
刚才说的是软件,人工智能其实还是比较烧钱的一个事情,后端的GPU的服务器,一台GPU的服务器好几十万。我们前段时间刚刚为觅影产品新增加了几十台的GPU服务器,价值好几千万,再加上之前的一些。
所以说做好人工智能一方面要靠大量的科学家,一方面靠大量标注好的图像、图片,外块也需要大量的钱做支撑。要做好人工智能的门槛还是比较高的。
从基础的沉淀上来讲,我们也在全球顶级的文献当中发表了数十篇的论文。在国家层面来讲,人工智能应用到医学领域,从国家来讲它的政策态度也是比较积极,包括在今年的总理的政府工作报告当中,人工智能也是第一次写到我们的政府工作报告当中。
另外在今年卫计委的十三五规划当中也提倡了应充分发挥人工智能的引领作用,所以说在人工智能应用于医疗的临床这块,国家的政策也是非常支持的。
AI医学影像技术如何应用到癌症早筛过程?
目前从觅影来讲,可以去辅助于这几项癌症:食道癌、肺癌、宫颈癌、乳腺癌和糖尿病引起的视网膜病变。
先看食道癌,根据2015年我们拿到的最新数据,中国的食道癌新发病例是47万,占了全球50%的份额,也就是说全球50%的食道癌患者在中国。食道癌的死亡率2015年是37.5%,是非常庞大的数字。食道癌是整个疾病当中死亡率的第三名,从区域上来讲,广东的汕头等等都是食道癌的多发区域,里面的原因有很多种。从食道癌的治疗来看,它的整个病期分为三期,早期、进展期和晚期。
对于食道癌的早期治疗来讲,现在基本上可以通过微创的手术,做完微创手术之后三五天病人就可以出院,并且术后的并发症比较少,花的钱比较少,早期食道癌一两万。但是晚期食道癌的治疗就是比较多了,包括要开腔做手术,并且就算做了这样的手术,癌症切除了,但是术后生活受很大的影响。治疗效果来看,早期食道癌治愈率达到90%以上,晚期40%都不到。对于食道癌的早筛也是非常重要的。
腾讯的觅影可以去利用我们的一些算法,人工智能的一些技术把医生或者PET系统(钛媒体注:正电子发射计算机断层显像技术)里面的影像传到我们的系统当中,我们能够用几秒的时间得到这个片子,可以判断这个片子是不是高风险的早期的食道癌,这个准确率达到90%以上。
在这个图片上可以看到左边的图片是从PET或者是医生传到我们模型里面的图片,经过我们的一些算法加工之后,变成了右边蓝色的图片,在这个蓝色图片当中大家可以看到亮点的部分就是病灶所在的部分,亮点越亮患癌症风险系数越高。这里面也可以看到我们对于图片的,对于病灶所在位置的判断也同样是非常精确的。
事实上觅影用于食道癌的早筛也已经在临床上得到了应用,包括深圳市南山医院,我们在发布之后做了差不多一周的时间,就成功发现了18例高风险食道癌患者,帮助南山医院发现了第一例早期的,利用人工智能发现了第一例早期的食道癌患者,患者经过医生其他的诊断,也确确实实确诊为食道癌早期。
大家知道中山肿瘤也是中国肿瘤界的很顶级的医院,一开始我们在这边做测试的时候,当时医生其实对我们的识别效果还是有一些疑问的,他一开始觉得我们对于一些病状比较明显的那些食道癌的检测,他觉得效果非常好,但是他说对于一些尤其早期的食道癌的病灶,肉眼看起来比较费劲的那些图片的识别效果怎么样呢。
后来中山肿瘤的医生他把自己珍藏了很长一段时间的一张片子拿到我们系统里面测试,这张片子应该说是从他的角度来看比较难判别的片子,这是他在知道答案的情况下观察了很久才发现的病灶,拿到我们的模型里面去计算,我们成功把这例很难发现的早期状况发现了。
我们是怎么做的呢?其实让人工智能识别一张图片,跟我们人类去识别一张图片原理差不多。
比如说我们人类看到一个黄头发蓝眼睛的人脑子里想的是老外,看到黑皮肤的可能是非洲人。还有一些更牛一点的,看一眼就能分辨出来是韩国人还是日本人,还是中国人。另外有的更牛逼还能看到对中国人看一眼还能知道可能是在哪个区域的,那人在看这些物体的时候,实际上也是经过一个过程。
第一个就是说他见过了大量的类似的图片或者类似的影像,已经存在在脑海里面。第二块很重要的就是对于识别物体特征的把握,特征的识别也是。比如说蓝眼睛黄头发这就是老外的特征。同样我们让机器去识别一张图片是不是癌症,也是这样的原理。
我们一方面在食道癌这块采集了差不多有几十万张食道癌的图片作为我们的训练样本,并且这个图片有一点需要明确,都是中国人的数据,为什么要强调这一点呢?其实在做AI医疗影像这块全球有很多公司在做,甚至有一些片子可能都有一些开源的,从网上可以下载到,但是很多片子都是老外的,老外的数据去训练中国人的模型,其实它的准确率还是比较低的,我们拿到的片子质量都是中国人的。
拿到片子之后,我们也同样把这个片子,因为在一张完整的食道癌影像当中,它的病灶只有一小块,大多数的区域是一个正常的,那我们把这个医疗原始的图片切成很小很多小的块,分别去估计每一个小块患癌的概率,最后得出一个诊断,这张片子是不是癌症。
从具体的过程来看,差不多有这么几个步骤。
第一块是作为一个对于医疗图片从PET系统或者医疗传统系统里面,首先我们对图片做一些预处理,第一个要去识别一些是食管还是不是食管,因为医生拍片子的时候有时候会拍到胃、十二指肠的位置,也会影响系统的学习和训练。
另外一块,不同的机器拍出来的片子颜色、大小、光照等等都有很多不同的区别,我们要对这些图片做规划处理,然后放到我们的模型当中。
第一步要对图片预处理,同时识别是食管还是非食管。第二步我们再放到我们另外一个模型当中,要去判断它这个是正常的还是有病变的,正常的和病变的这块也是区别比较大的。第三步也是最关键的一步,我们可以分辨是炎症还是癌症。
对于一些基层的医疗机构来讲,很多情况下往往把识别正常和不正常相对来讲是比较简单的,但是去判断是癌症还是炎症,这个对于医技的要求还是比较高的,因为它的区别在图像上来讲比较细微的。
我们除了在这块判断炎症和癌症,除了完全基于图象识别的技术之外,也会加入其他方面的诊断。所以说通过刚才一系列的这样一个手段,我们对于癌症的判别精确度是90%,并且也是经过临床的验证,这个不是实验室里面能够测试的数据。另外一块就是觅影在肺癌当中的应用,大家知道肺癌是某种程度上来说是癌症之王,不管是发病率还是死亡率都是NO.1。
在中国也同样,根据2015年的数据,中国肺癌发病率73万,占全球35.8%,另外肺癌中晚期死亡率非常高。但是同样早期的筛查可以去将肺癌的五年生存率提高到80%以上。
大家知道对于肺癌的早筛其实最主要的手段是什么?
是要查看肺部影像片的肺结节。这个肺结节非常小,不管是国内还是国外,对于肺癌的AI的研究其实比较多,但是对于寻找肺结节,很多公司的研究只能找到5毫米以上的肺结节,因为肺结节非常的小。
我们可以做到三毫米以上的识别,并且把3毫米以上肺结节识别的准确率达到95%。另外一块,肺结节也有良性和恶性,那对于良性恶性的,对于肺癌的识别率,早期肺癌的识别率,我们的准确率能达到80%。
从肺癌早筛拍的CT来讲,一方面它的肺结节比较小,所以说就算有经验的医生通过肉眼去看,有时候误诊率也比较高。还有一个比较痛苦的事情,一个CT它的图片是200层左右,当然不同的机器不一样,200层的片子要靠人工去看很难的。
我们是怎么做的呢?
第一步做预处理,把200层的片子拿过来首先做一些筛查,比方说去掉片子里面拍的其他的部位。
第二,由于片子拍出来是平面的,我们第二步需要把它3D化、立体化。
第三,肺结节非常的小,另外来讲的话,不同的机器拍出来的CT片子,它的数据指标也是不一样的,所以我们还需要对成型后3D图像进行一些擦除和增强,得出一个机器可以识别的增强后的3D的图片。
腾讯觅影早期肺癌筛查敏感度是96%
在这点来讲我们的优势是什么?不管你是什么类型机器拍出来的片子,都能够搞定。在我们已经做过的很多家医院遇到的CT型号还是非常多的,所以基本上我们做过的准确率都还可以。
第二个做完预处理之后,我们从下往上看,把前端增强后的图片放到我们一个3D的卷积神经网络当中进行判别,然后在这里面我们也有很多多尺度的算法,算法逻辑在里面,可以比较精准的找到微小的肺结节位置,并且可以把这个位置明确标识出来。
再下一步的话,在这一步来讲,我们可以去找到微小的肺结节,最后我们要去判断这个肺结节是良性的还是恶性的,也就是说是不是癌症。我们除了根据图像识别的原理之外,也加了肺结节的位置跟其他信息的关联度,最后我们得到的准确率是80%左右,3毫米以上肺结节识别率90%,肺癌的患病率80%以上。
这是我们的数据,可以看到对于3毫米以上,3到10毫米我们的识别率95%,这是高于全球腾讯以外的最高的水平。另外对于良恶性的判别,我们的数据敏感度85%,特异性90%。
我们实际临床应用当中,把这个产品拿到医院用,好多医院的医生一开始对我们不是很信任的,医生在前期跟我们合作的时候,也去拿了自己珍藏的50张片子放到我们这个模型里面,并且也搞了差不多20个医生,比较有经验的医生来跟我们机器做这样一个比赛,这个比赛分两块,一个是找肺结节,一个判断是不是癌症。
这是真实的数据,对于早期肺癌的敏感度,腾讯的觅影数据是96%,20名医生的平均水平是77%。在特异度来讲我们数据是88%,普通医生是81%。
从腾讯觅影在肺癌这块的筛查来讲,一方面能够精确定位到三毫米以上的肺结节,为什么一直强调三毫米呢?因为国际上其他很多公司做的都是五毫米,越小的肺结节越难发现,对后端的资源要求越高。
另外一块来讲找到肺结节,同时判断良性还是恶性,并且已经达到了普通医生的水平,并且跟比较优秀的医生水平应该是相当的。这样的产品一方面用在三甲医院,提高医生的诊断效率,放在基层医院可以提高早期肺结节筛查的医疗效果。
觅影用在第三个应用场景就是糖尿病性视网膜病变智能筛查,因为对于糖尿病患者来讲,它患一段时间的糖尿病以后,也是因为胰岛素的原因,会造成眼睛的失明,并且这个失明是不可逆的。
从这个比例来讲,致盲率在30%几,这个比例也非常高的。尤其对一些欠发达地区患了糖尿病以后觉得眼神不好,他觉得可能跟糖尿病没有关系,他觉得可能就是眼睛不好,所以就错过了很多治疗的机遇,造成了不可逆的失明。
对于糖网病人来讲,它一方面我们对于糖网的识别率达到97%,这个其实也是非常高的一个数据。另外一块来讲糖网从医学上来讲分五期,不同阶段治疗的手段不一样的,我们可以对于病人它的糖网的所在分期的准确率达到75%,也就是说通过腾讯的觅影我很快得到它是不是糖网,另外它处于糖网的几期,如果说这个数据是确认以后,医生可以根据这个结果采取相应的医疗手段,所以说这个数据是比较必要的数据。
除了前几个之外,还有一个是乳腺癌,这也是女性同胞们患病率最高的一块。对于乳腺癌来讲目前早筛的手段差不多有这么几种,一般体检里面做的PET-CT,但是CT对于乳腺癌的诊断只能拍到肿瘤,因为乳腺癌它分严重性,一种是肿瘤,一种是钙化,CT可以拍到肿瘤。第二种诊疗手段是木板,判断是不是肿瘤,同时看是不是有钙化,第三是磁共振,这个资源比较少,价格比较高。
还有终极手段就是做病理分析。在病理这块的图片,一个乳腺癌的病理图片大概是10万像素,非常庞大的图片,在这个庞大图片中,我们去找到病灶的位置,就算是有经验的医生,找起来也是非常难的,因为图片实在太大了。在这块对于病理图片的识别我们的准确率是83%,这是对于精准位置的一些提取。
从前面几个来讲的话,无论是在食道癌、肺癌、乳腺癌、宫颈癌还是糖网上面,觅影表现的数据其实都还相当不错的,并且这些数据也是经过我们临床的一些临床测试。
未来计划
觅影虽然是今年8月份才正式发布的,但实际上腾讯在觅影这块的打造其实也是沉淀了很长时间。腾讯出一个产品一向是这样,我们做一款产品不一定做的最早的,也不一定做的最快的,但是一旦把产品做出来,一定是做到最好的,这个最好的目标不仅仅是全国最好,是要全球最好。
从觅影这块的应用来看,我们一方面是在三甲医院合作,提高三甲医院医生看病的效果。第二,更多还是希望跟基层医院进行合作,提高基层医院整个的诊疗水平。同时我们觅影这个产品也会跟腾讯基金会合作,通过一些公益基金的项目,针对一些癌病高发区做一些筛查,利用技术给国家和人民造福。
从腾讯来讲,在医疗这块其实不仅仅是医疗影像,我们还包括应用腾讯的包括海量数据,包括多方面的资源整合的能力,也是希望去提供包括基于微信的结算、支付,包括在线问诊等等这方面,用户服务等等这个应用。
此外我们也希望通过腾讯的技术和底层能力给医院和医疗机构的管理提供技术方面的支撑。另外一块对于学术科研,我们一方面腾讯自己不遗余力投入,另外一块也会跟很多医疗机构合作。
医疗这个产业来讲非常大,从医疗的事业来讲利国利民,单纯靠腾讯一家很难做到更好,我们在这块来讲也会跟合作伙伴一起合作,这里面也包括地方政府,也包括医疗机构、保险机构和其他很多的一些友商,利用人工智能这些技术、腾讯的能力,真正做一些造福人类的事。(本文首发钛媒体)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App