【钛坦白】DeepCare刘圣:人工智能在病理领域的算法实现和产品化思路
这是钛媒体专业用户和付费用户专享的“钛坦白”在线课堂第29期,我们请来了三位钛客,给大家讲讲人工智能在医疗领域的应用。
本文根据本期钛客之一,前麦肯锡资深咨询师、DeepCare 羽医甘蓝科技创始人、CEO刘圣的分享整理了部分摘要,全文需要成为钛媒体专业用户才可以查看。进入钛坦白相关交流群交流,以及进入钛媒体专业版查看更多更丰富的专业数据和信息,点击:http://www.tmtpost.comhttp://www.tmtpost.com/pro 注册成为钛媒体专业用户。
以下是刘圣在钛坦白的分享:
我叫刘圣,我们公司叫DeepCare,就是deeplearnig和heachcare两个单词的组合,我们主要做的是把深度学习运用在医疗影像的识别上。
市场的需求
病理被称为是医生的医生,服务对象其实不是病人,而是临床医生。也就是说,病理医生会诊断出病人罹患的是良性的肿瘤还是癌症,如果是癌症,会给癌症分期分型,然后把这个诊断交给临床医生。临床医生会根据这个诊断来给病人制定治疗和用药的方案。
讲到这里,我来问大家一个问题,大家都知道现在看病很难,不知道有哪位朋友花钱买过黄牛的票呢?我们买专家号看到的医生和我们挂普通号看到的医生,在诊断大病上的精确度到底有多大的差距呢?
两个月前,我们做了一个实验,请了北京的特级三甲、普通三甲和地方上的三甲医院的一共四名医生看70张乳腺癌转移的片子。这四名医生的年资分别是40年经验、30年经验、20年经验和10年经验。70张乳腺癌的片子有30张是阴性的,就是说没有癌细胞的,有40张是阳性的就是有癌细胞的。
我们请这四位医生看这70张片子,那位40年经验的医生的准确率达到了98%以上,剩下的三位病理医生,他们的平均准确率在70%左右。
就这个实验来说,专家和普通医生差距确实还是挺大的,怪不得黄牛号这么贵。我们做这个实验,一方面是为了比较不同的医生看病理切片的诊断会有多大的差异,另外一方面,我们用我们的算法也对同样的70张片子进行了诊断,当时我们的准确率是93%,那是在两个月以前,现在我们准确率已经超过了95%。
从这个实验也可以看出,一方面,中国的医疗资源确实是非常不平均,专家和普通医生之间的差距确实非常的大;另一方面,在一个定义非常明确的问题之上,算法其实可以做到比人或者是比一般人更好,可以无限接近最厉害的或者是最强的那个医生的水平。
我们现在在做的事就是和北京的这些病理科,全国最强的科室的医院合作,开发出智能算法,然后把这些算法运用到基层医院和三四县城市当中去。
下面这张图片,左边是属于正常的细胞,右边属于癌变后的细胞。为什么一个病理医生这么难培养?因为有上千种疾病可能有上万种不同的变化,这些变化让任何一个人用人脑来记都是非常非常困难的。
一张病理切片里面包含的信息是非常大的,有十几亿个像素点,一张压缩过的图片大概也有几个G的大小,这么大量的信息让人的眼睛来观察,可以说非常辛苦,这种工作其实是非常适合计算机来做的。
在中国病理医生非常的缺乏,大概平均七万中国人一位病理医生,而在美国是平均两千人一位病理医生。中国如果想达到美国的这个数字,按照中国现在培养病理医生的速度大概要200年。我们在做的事情就是用人工智能的方式来弥补这个供需上的不平衡。
算法上的实现
下面这张图片是我们诊断的流程。我们会把处理切片的算法分成三步:
- 第一步,预处理。就是把含有组织的这个部分从切片上面挑出来;
- 第二步,神经网络的处理分类。先把这些挑出来有组织的部分切成小块,大家看这个图的右上角,每一个小块有一定大小,模拟医生在显微镜下看到的大小,然后把每一个小块放到显微镜神经网络里面,判断这个小块里边是否含有癌细胞。大家可以看到,下面中间的这个蓝色的图就是最后结果的一个可视化的表达,它其实是一个热力图;
- 第三步,后处理。就是从一个热力图得到最后的诊断报告。
我们的很多技术壁垒都是在第三步,这里有很多的医生的先验知识,比如我们希望能把医生脑袋里边的算法变成电脑的算法,所以在这个里边,我们一共从大概六十几个不同的维度,有医学方面的维度,也有非医学方面的维度,共同来处理热力图,最后把它变成一句话的诊断,比如说这是什么癌,什么类型。
我们打算分成三步实现:
(以下全文仅限钛媒体专业用户开放,点击链接:http://www.tmtpost.comhttp://www.tmtpost.com/pro 注册钛媒体专业版)
⋯⋯
⋯⋯
⋯⋯
产品化的一些想法
很多朋友一定会问,算法要多准才可以用?要怎么样用?大家可以看看下面这张图:
⋯⋯
⋯⋯
⋯⋯
Q&A:
1、请问刘大大,这套识别流程对其他疾病的识别是不是也能复用呢?
刘圣:每个疾病都要重新训练,所以只能一个疾病一个疾病来。主要是数据的标注,技术路线是一样的。
2、请问刘总,目前你的商业模式是和医院的病理科合作,通过承接他们的图像分析,获得收益?
刘圣:其实我们急着产品化,但是不急着商业化。所以目前医院都是免费试用,未来我相信只要创造出价值,一定可以找到商业模式。医疗是个慢生意,人工智能也是个慢生意,两个加一起就更慢了。
3、刘总你好,卷尺神经网络构建后通用性较为强,现在,在CT、MRI影像领域比较多。不知道,在心电图辅助诊断、内窥镜这些小众领域,是否有价值?
刘圣:内窥镜一定可以,我们之前有做过。心电图也有可能,但是一般的心电图其实不需要CNN来做,冠状造影可能更可以发挥CNN的优势。
(本文独家首发钛媒体,根据DeepCare 羽医甘蓝科技创始人、CEO刘圣在钛坦白微信交流课上的分享整理)
………………………………………………
钛坦白第29期,人工智能在医疗健康领域的应用,三晚上的分享已经结束。
干货会陆续发布:http://www.tmtpost.com/tag/1508094
钛坦白第30期预告:跑步和相关赛事运营
时间:2月20日、21日、22日,每晚7点开始
地点:钛坦白|体育(微信群)
报名听课、参与垂直人群互动:
钛坦白目前有医疗健康、人工智能、文娱社交、VR/AR、区块链、支付创新、体育、云计算、SaaS等九个专业群。
1、钛媒体Pro专业版用户,可以点击链接http://www.tmtpost.comhttp://www.tmtpost.com/pro,登录账号,点击进入“在线课堂”,在线免费、任意选择自己要进入的群,按提示操作;
2、非钛媒体Pro专业版用户,可以添加微信号taitanbai0,在通过好友后,发99元红包给小钛,你将有权利从九个群中任选一个群进入,长期听课、交流。请告诉小钛你要进入哪一个群,然后等待小钛拉你入群~
推荐钛客、赞助、合作:
请与钛坦白负责人佳音联系,邮箱jiayinge@tmtpost.com
成为钛媒体专业版用户,阅读全文。
成为钛媒体专业版用户点击了解详情
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App