阅片机器人在普及之前,还需要解决这三个问题
还记得你上次为了看一个X片的结果在医院排队排了多久吗?
在传统医学上,医生需要把片子对着灯光一张一张来看,费时费力,而且一旦疲劳,阅片的成功率会有所下降,产生判断错误的概率。
不过这个问题很快可能会得到解决。日前在央视一套一档人工智能节目《机智过人》中,一阅片机器人几秒内看了三百多张CT片,连撒贝宁都惊诧懵了。
如果你对于医学影像识别领域有所关注的话,2017年最有趣的事莫过于杭州健培科技与阿里巴巴iDST视觉计算团队,在国际权威肺结节诊断大赛LUNA16的世界记录之争。最终,健培的“啄医生”阅片机器人以91.3%的平均召回率重回第一,并且创造了新的世界纪录。通过这场世界记录之争,其所反映出的是我国阅片机器人这一细分领域的蓬勃发展。
事实上,从肺部影像人工智能诊断系统“天肺一号”的推出,到腾讯的“腾讯觅影”、阿里巴巴“ET医疗大脑”纷纷入场搅局再到阅片机器人“视诊通”大战84位影像科的专业医生、“啄医生”阅片机器人与15名三甲医院主治医师打成平手,方兴未艾的阅片机器人已经博得社会各界阵阵热议,人们也在对它无限遐想。
阅片机器人真的能做到既快又准 ?
AI机器人凭什么能做阅片?
随着AI在医疗领域的深度落地,AI机器人在大数据和算法技术的支撑之下,能够对MRI图像、CT图像、超声图像等医疗影像进行识别和处理,并且通过进行自主学习,来不断提高处理的能力和效率,从而能够辅助医生来进行阅片诊断。
一般来说,在唤醒机器人后,阅片机器人的运行会经过图像输入、图像分割与识别、图像分析和信息输出四个步骤。图像输入是指将张数不等的医疗影像输入进阅片机器人,例如一整套CT图像大概由200到600张切片组成;图像分割与识别是指阅片机器人会对于输入的序列图像进行算法分割与识别,标注病灶等;图像分析是指对于病灶进行相关分析,包括磨玻璃的密度、实性成分占比等等,如阿里巴巴“ET医疗大脑”的智能诊断功能就是基于深度学习之后,发掘病灶的内在规律;信息输出指将所得出数据进行汇总,得出报告。
通过对阅片机器人的运行路径观察,我们不难发现其具有高效率、客观性等特征,能够在提高医生诊断效率的同时,减少人为失误率。
阅片机器人的“爆红”为什么是在这个时候?
另外,阅片机器人的快速发展其实是与算法技术在此领域的成熟应用分不开的。阅片机器人的核心就是医学图像的处理技术,包含图像的去噪、增强和分割等,而这背后则是算法技术的支撑。智能相对论查询诸多文献后,发现目前比较常用的算法有蚁群算法、模糊集合论、卷积神经网络算法以及各种算法之间的融合等。
1、蚁群算法(Ant Colony Optimization)
蚁群算法是在研究蚂蚁觅食的过程之中,所得出的用来寻找优化路径的概率型算法。在医疗图像处理之中,常常是基于区域内部灰度相似性和区域之间灰度的不连续性来进行图像分割的。因此能够利用蚁群算法的“正反馈”效应以及分布式的计算方式,来完成对于输入图像的分割。
2、模糊集合论(Fuzzy Sets Theory)
待考察的对象及反映它的模糊概念作为一定的模糊集合,建立适当的隶属函数,通过模糊集合的有关运算和变换,对模糊对象进行分析。目前基于模糊集合论的图像处理方法包括模糊连接度割法、模糊聚类分割法等。
3、卷积神经网络算法(Convolutional Neural Network)
卷积神经网络由人工神经网络发展优化而来,是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。卷积神经网络采用了局部连接和共享权值的方式,避免了对图像的复杂前期预处理,可以直接输入原始图像,并且还具有良好的容错能力、并行处理能力和自学习能力,可处理复杂的环境信息。据悉,“啄医生”采用的算法就是运用了中科大的安虹教授团队基于影像识别的3D卷积神经网络算法上进行的优化。
正是这些算法的成熟,才促成了这些“阅片机器人”性能的快速提高,也让它“飞入寻常医院”加快了脚步。
阅片机器人在普及之前,还需要解决这三个问题
不过,尽管阅片机器人有着科学和强大的技术支撑,但要全面进入医疗应用阶段,让所有人都不用再去排队苦等医生诊断,还需要一点时间。目前主要的三大不确定因素主要表现在程序设定、数据学习和数据保护三个方面。
第一,程序设定上的失误,可能促使误诊的大规模发生。
阅片机器人目前仍然达不到100%的精确判断,正如开头所提到,目前肺结节诊断正确率的世界纪录为91.3%,“视诊通”在进行“甲状腺结节超声图像的性质判定”时正确率也只有76%。其原因一方面是受到目前客观科技水平的限制,另一方面则是人的主观失误。
正如前文所介绍,支撑阅片机器人运行的是一整套由人预设好的程序,程序的各个环节紧密相连,前后相继,最终完成阅片机器人的工作。而人的主观失误正是体现在程序的预设上,如果其中任何一个环节设定出现了纰漏,会使得最终的数据报告出现偏差,从而会导致医生的诊断和治疗方案失误。此前强生CTC检测仪器Cellsearch系统就被爆出存在包括X、Y、Z轴移动超时、复位错误等共37个类别的问题,所幸仪器在问题发现之前还未造成严重事故。
第二,急需更多有质有量的案例,提升学习能力。
AI阅片机器人实现自我学习功能的根基是大量的学习数据输入,学习数据的质和量都对AI阅片机器人产生重大的影响,学习的数量越多、案例越典型,识就别的速度和质量会越高。相较而言,目前医疗相关数据在质和量上都存在着问题。其一是大量的医疗数据未进行电子化,其二则是医院与医院之间存在藩篱,缺失共享、开发的数据库。在《机智过人》的节目之中,健培科技CEO程国华透露其阅片机器人学习的医疗影像资料为十万套以上,而同场竞技的主治医师都为二十万套以上。再来一个数据可能会更为直观,战胜人类棋手的AlphaGo一共学习了数百万人类围棋专家的棋谱。
第三,医疗数据监管力度不足,个人隐私保护成疑。
阅片机器人进行诊断的医疗影像资料报告在输出给医生的同时,也通过信息传输技术,保存在了机器生产商的云平台之中。经过时间的积累,机器生产商所拥有的个人数据会非常庞大。而这也就意味着,在目前我国医疗数据监管乏力的情况之下,个人的隐私将受到极大的威胁。
在去年浙江松阳所破获的一起特大侵犯公民个人信息案件中,犯罪嫌疑人入侵某部委的医疗服务信息系统,获取各类公民个人信息达7亿余条。正如和美医疗控股有限公司创始人林玉明所提倡的一样,希望国家对数据立法来保障个人的隐私安全。
目前阅片机器人所取得的成就,标志着我国在AI部分细分领域的突破性发展。尽管有些问题待解,但我们依然期待机器人能缩短我们看病排队的时长,去医院不再“难于上青天”。
【钛媒体作者介绍:智能相对论(微信id:aixdlun),文 | 黄信鹏】
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App