医学影像大数据与人工智能的“前世今生”

数据观 • 8年前扫码分享

— 1 —

从望闻问切到医学影像

正常情况下，人体内的器官和组织是无法用肉眼看见的。在古代，扁鹊、华佗等名医通过“望、闻、问、切”来诊断患者的内部病因，这是那个时代最“先进”的诊断方式。

公元1816年的某一天，法国医生雷奈克在街上散步，偶然看到几个小孩儿用一颗大钉敲击一根木料的一端，而其它的孩子则用耳朵贴在木料的另一端来听声音，这给了雷内克医生极大地启发。他回到家后，马上找人专门制作了一根空心木管，这便是人类历史上的第一个听诊器，后来，听诊器被广泛用到了心脏和妇产科领域。

法国医生雷奈克用木管听诊

到了近代，医生观察病人体内的状况，不再仅仅通过听诊器来解决。1971年，CT的问世标志着医疗影像学的正式建立，随着医学成像技术的进步，由放射科演变而来的医学影像科成为临床医学中发展最为迅速的学科，从传统的X光检查扩展到超声波、放射性核素显像、X-CT、MRI、数字化成像，以及当今最高端的PET-CT技术。医生借助这些新技术，来更加深入地“窥探”人体内部的病变情况。

— 2 —

影像数据的融合大师——PACS系统

医学影像设备的出现，让医疗机构的诊疗工作越来越多依赖医学影像的检查。传统的医学影像管理方法（胶片、图片、资料）日积月累、年复一年存储保管，堆积如山，给查找和调阅带来了诸多困难，医院丢失影片和资料时有发生。传统的文件管理方式，已经无法适应现代医院中对如此大量和大范围医学影像的管理要求。

随着数据库技术和计算机通讯技术的发展，数字化影像传输和电子胶片应运而生。众多医院纷纷进行了医院信息化改革，随着影像设备逐渐更新为数字化和互联网的逐渐成熟，无胶片放射科和数字化医院成为了现实。关于电子胶片，我们将在下一篇文章里详细介绍，这里暂时先不细说。

为了对不同医学影像设备的信息化数据进行统一存储和管理，各平台数据的融合大师——PACS系统诞生了。

PACS系统英文翻译过来就是影像归档和通信系统的意思。它的主要任务是把日常产生的各种医学影像（包括核磁，CT，超声，各种X光机，各种红外仪、显微仪等设备产生的图像）通过各种接口（模拟，DICOM，网络）以数字化的方式海量保存起来，当医生需要它们的时候，便如同管家一般把数据快速调回使用，完美充当了各仪器之间的润滑剂的作用。

PACS系统应用示意图

完整的PACS系统，主要功能由三个方面组成：一是图像的采集，二是数据的传输和存储，三是影像分析和处理。

影像的采集方式主要有三种：分别是纯数字采集、视频采集和胶片扫描。

而信息存储方面，PACS系统针对结构化数据和非结构化数据，采用了两种不同的方式来分别进行存储。使用数据库来管理病人信息等结构化数据，使用文件系统来管理图像资料等非结构化数据。就好比一个人带着行李去乘坐飞机，行李被托运进了行李舱，而人则坐在机舱内，两者各行其道、互不干扰。

此外，由于医学影像的数据文件往往较大，常规一次CT扫描为10MB量级，X光机的胸片可以到20MB，而心血管造影的图像可达80MB以上。传统的方式一般是利用服务器和光盘来进行存储，比较死板，难以进行功能扩展。而目前新兴的云计算云存储技术具有数据快速调用、网络共享与应用拓展等功能，与PACS系统相结合，将是未来影像存储的一大方向。

其原理也很简单：医院将PACS系统部署到第三方云平台，通过云平台的分布式、负载均衡的集群系统，实现全天候影像存储。云平台的建立，还可以实现跨平台、多终端、PC和移动设备的全面融合，进而彻底实现影像无纸化、无光盘化、无胶片化。

这种全新的模式，不仅提升了每一位医生的工作效率、工作质量，并且丰富了医生的协作工作场景。此外，医院也不用再去花重金购买服务器，从而减少繁琐的后期维护和扩容，以到达节省成本的目的。

OK！数据存储的问题解决了，但数据的标准化又成为了新的问题。虽然医院可以利用PACS系统来实现各类仪器之间的信息互通，但由于不同厂家的设备和不同PACS系统所使用的数据标准各不相同，让信息的采集和传递非常困难。就好比不同语言和国家的人遇到了一起，你讲你的ABC，我说我的吃了没。如何让这些不同国家、不同厂家的产品形成统一的标准，成为了最大的障碍。

这方面，美国人总是走在时代的前沿。1985年，美国放射学会ACR和美国国家电器制造商协会NEMA共同制定了一种规定数字医学影像和相关信息格式及信息交换方法的标准：医学数字成像和通信标准（digital imaging and communications in medicine），缩写为DICOM。DICOM的出现，重新定义了临床数据交换的医学图像格式。

在DICOM标准下，影像设备提供统一标准的影像数据给PACS系统。而对外通讯方面，PACS系统仍然使用DICOM，这样就形成了最大限度的统一。简单来说，就是让各家的仪器统一用一种接口，就好比我们将英语作为世界的通用语言。

1993年，DICOM顺利发展到了第三代，也就是DICOM 3.0标准。随着越来越多国家的医疗设备厂商宣布支持DICOM 3.0标准，DICOM 3.0逐渐成为了全世界医疗影像行业公认的标准。

PACS系统最初主要用于放射科，作为医院HIS系统的核心组成部分，在构建进入医院信息系统网络时普遍遵循HL7标准和IHE规范。随着HL7标准和IHE规范的不断完善，PACS已经从简单的几台放射影像设备之间的图像存储与通信，扩展至医院所有影像设备乃至不同医院影像之间的相互操作，因此出现诸多分类叫法，如Mini PACS（微型PACS）、科室级PACS、全院级PACS、区域PACS等。

• Mini-PACS：是指只用在单一类型的影像设备，CT或者MRI等。

• 科室级PACS：放射科多台影像设备可实现影像、诊断报告共享。

• 全院级PACS ：将全院各科室临床主治医师、放射科医师和专科医师以及各种影像、医嘱和诊断报告联成一网。

• 区域PACS：本地区、跨地区广域网的PACS网络。

科室级PACS系统示意图

总之，PACS系统的出现，既解决了图像的采集问题，又解决了数据的传输和存储问题，至于尚未提到的影像的分析和处理，我们在后面来详细说明，在此之前，先来了解下医学影像大数据。

— 3 —

我国医学影像大数据的形成原因

作为一个新名词，到底是先有医学影像大数据，还是先有 医疗大数据 ，现在已经无从考证了。但要解释医学影像大数据，必然要搞清楚两点：一是医学影像大数据的定义，二是医学影像大数据的形成原因。

大数据的定义，是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

IBM则总结了大数据的5V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（价值）、Veracity（真实性）。

医学影像大数据，如果按照大数据的定义，是由DR、CT、MR等医学影像设备产生所产生并存储在PACS系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与医院信息系统（HIS）大数据、检验信息系统（LIS）大数据和电子病历（EMR）等同属于医疗大数据的范畴。

多结构和高价值这两点很好理解，是由日益增长的医疗影像设备种类所产生的具有医学分析和指导价值的结构化和非结构化数据。大规模和高增速，则需要从大环境来解释。

我国医学影像大数据的形成，主要有两方面的原因：一是市场，二是人口。

从市场规模来看，截止2015年6月，我国三甲医院数量为705家；CHIMA2014-2015年的数据显示，我国科室级PACS、多科室或院级PACE系统建设水平已经分别达到了60-70%和50-60%，基本覆盖国内一线城市的三甲医院。

从市场增速来看，我国PACS市场年均增速在25%以上。根据ACMR的调查数据，2012-2015年，中国PACS市场继续以20%以上的增速扩大。

数据来源：ACMR

而人口方面，影响医疗影像大数据的形成原因主要是人口基数和年龄的分布。据国家统计局第六次全国人口普查主要数据公报，全国总人口数约为13.7亿。从老年人口的增速和比例上看，截至2014年底，我国60岁以上老年人口已经达到2.12亿，占总人口的15.5%。据预测，到本世纪中叶，我国老年人口数量将达到峰值，超过4亿，届时每3个人中就会有一个老年人。

所以，目前PACS系统的普及率和人口数量的庞大，是我国医学影像大数据的大规模基础；而PACS系统和老龄人口的快速增长率是医学影像大数据的高增速的基础，这两者共同构成了我国医学影像大数据的形成原因。

作为大数据5V特征中的最后一环，医学影像大数据的真实性，应该通过何种方式去实现？这就要涉及到数据处理技术了。

— 4 —

数据处理和“鱼香肉丝”

简单来说，PACS系统从不同的影像设备收集到的数据在质量上往往参差不齐。而数据分析和输出结果的错误程度和可信度在很大程度上取决于收集到的数据质量的高低，所谓“垃圾进，垃圾出”，没有数据的准确性保证， 大数据分析 就变成了一纸空谈。

目前医学影像后处理方法主要包括两类，一类是直接处理技术口，对患者进行影像学检查后，直接采用软件技术对影像在影像设备上进行处理，例如在CT和MRI设备上进行血管成像等。这种方式的缺点比较明显，不能对影像进行改变，只能依靠医生依据自身的经验进行病理学处理，这就导致了数据结果的不准确性。

举个例子来说，当CT 图像遇到相互组织成像重叠时，普通的软件图像处理往往会将这些重叠的数据理解为噪声或者其它干扰信号，而医疗专家则需要保持图像上面边界或者目标轮廓的边界具有的几何保持纺射不变（简单来说就是保持图像的完整性），这就对医生的诊断带来了难以预料的困难。

除了影像设备软件处理外，还有一种方法，通过影像设备将影像数据传递给PACS系统，由PACS系统来对影像进行后处理。比如PACS系统通过多维影像融合（CT/MRI/PET-CT）技术，来对图像进行分割、配准和聚类，从而尽可能保存影像数据的真实性。

多维影像融合（CT/MRI/PET-CT）示意图

多维影像融合这项“黑科技”主要包括数据预处理、图像分割、特征提取以及匹配判断这几个过程。听上去可能让人感到有些懵逼，简单来说：数据预处理是指医学影像数据库中含有海量的、不同来源的原始数据, 其中带有大量模糊的、不完整的、带有噪声和冗余的信息。因此在数据挖掘前, 必须对这些信息进行清理和过滤, 以确保数据的一致性和确定性, 将其变成适合挖掘的形式。

我们很清楚，医学影像数据库里包含大量的图像数据。为了便于说明，我们把这些图像数据比作各种食材，将最终处理完成的信息比作鱼香肉丝这道菜。

数据预处理，可以把它想象成清洗食材的过程，要做鱼香肉丝这道菜，你得先把猪肉、胡萝卜、青椒乃至于葱姜蒜都一一洗净，滤掉残渣，留下精华，才能做接下来的步骤。这个阶段，包括图像去噪、增强、平滑、锐化等工作，统称为数据预处理。

“食材”清洗完毕后，就进入到图像分割和特征提取环节，这个环节我们可以假设为“食材”的切丝切段的过程。以国内知名医学影像公司汇医慧影为例，利用多维影像融合技术，通过器官形态模型，图像边缘特征模型，以及神经网络聚类模型，计算机自动将盆腔CT的膀胱，前列腺，直肠等自动分割（分割精度<2mm.），从而为后期的智能匹配和判断提供必备的图像处理工具。

最后一个环节，我们将经过前两道工序处理好的“食材”，和着葱姜蒜炒成一盘鱼香肉丝，这便是图像匹配和聚类的过程。这个阶段的PACS系统所依赖的核心技术为深度学习，也就是我们所说的人工智能，接下来，我们来了解下人工智能是如何应用到医学影像领域的。

— 5 —

不准确、缺口大，人工智能的出场背景

今年8月，国务院印发了《“十三五”国家科技创新规划》的通知，人工智能成为一大重点。《规划》明确指出，重点发展大数据驱动的类人智能技术方法;突破以人为中心的人机物融合理论方法和关键技术，研制相关设备、工具和平台;在基于大数据分析的类人智能方向取得重要突破，实现类人视觉、类人听觉、类人语言和类人思维，支撑智能产业的发展。

在我们探讨如何将人工智能应用到医学影像之前，先要搞清楚在没有人工智能的情况下，医学影像所面临的两个问题。

据动脉网了解，医疗数据中有超过90%的数据来自于医学影像，但是这些数据大多要进行人工分析。人工分析的缺点很明显，第一是不精确，只能凭借经验去判断，很容易误判。中国医学会的一份误诊数据资料显示，中国临床医疗每年的误诊人数约为5700万人，总误诊率为27.8%，器官异位误诊率为60%，恶性肿瘤平均误诊率为40%，如鼻咽癌、白血病、胰腺癌等，肝结核、胃结核等肺外结核的平均误诊率也在40%以上。

第二是缺口大，按照动脉网蛋壳研究院的数据，目前我国医学影像数据的年增长率约为30%，而放射科医师数量的年增长率约为4.1%，其间的差距是23.9%，放射科医师数量增长远不及影像数据增长。这意味着放射科医师在未来处理影像数据的压力会越来越大，甚至远远超过负荷。

放射科医生工作示意图

这点从现阶段放射科医师的工作状况也能看出来，今年1月份，医学界曾对1241名医学影像医生做过调查，其中有一项数据很值得注意：有超过71%的影像医生期盼放射假的回归。

报告里的数据显示，有超过50%的医生工作时间在8小时以上，20.6%的医生每天平均工作时间超过10个小时，多位医生反映放射假有名无实。不少医生留言，希望有天能享受到被剥夺已久的放射休假和公休假，多陪陪家人！

那么，面对目前医学影像误诊率高、缺口大的问题，应该通过何种方式去改变呢？最好的答案，便是人工智能。

— 6 —

人工智能的黑科技——多层卷积神经网络结构

人工智能在医学影像的应用主要分为两个部分：第一个部分是图像识别，在前文我们已经作了说明；第二个部分深度学习，是人工智能应用的最核心环节。这两个部分都是基于医学影像大数据所进行的数据上的挖掘和应用。

2006年，神经网络领域的大师Geoffrey Hinton教授与其博士生在《Science》和相关期刊上发表了论文，首次提出了“深度信念网络”的概念。与传统的训练方式不同，“深度信念网络”有一个“ 预训练 ”（pre-training）的过程，这可以方便的让神经网络中的权值找到一个接近最优解的值，之后再使用“ 微调 ”(fine-tuning)技术来对整个网络进行优化训练。这两个技术的运用大幅度减少了训练多层神经网络的时间。他给多层神经网络相关的学习方法赋予了一个新名词–“ 深度学习 ”。

2012年，Hinton教授的研究团队参加了斯坦福大学Fei-Fei Li教授等组织的ImageNet ILSVRC大规模图像识别评测任务。该任务包括120万张高分辨率图片，1000个类比。Hinton教授团队使用了全新的黑科技多层卷积神经网络结构，突破性地将图像识别错误率从26.2%降低到了15.3%。这一革命性的技术，让神经网络深度学习以极快的速度跃入了医疗和工业领域，这才有了后来一系列使用该技术的医学影像公司的出现。

比如国际知名的医学影像公司Enlitic和国内刚刚获得有峰瑞资本600 万天使轮融资的DeepCare。都是通过积累大量影像数据和诊断数据，来不断对的神经元网络进行深度学习训练，从而提高医生诊断的准确率。

Enlitic公司人工智能辅助医学影像诊断示意图

以Enlitic公司开发的恶性肿瘤检测系统为例，它通过使用肺癌相关图像数据库 “LIDC（Lung Image Database Consortium）”和 “NLST（National Lung Screening Trial）”进行验证，结果发现，该公司开发的系统的肺癌检出精度比一名放射技师检查肺癌的精度高5成以上。

总而言之， 人工智能 结合医学影像的益处多多，患者、放射科医师、医院均能从人工智能的应用中受益。人工智能不仅能更帮助患者更快速地完成健康检查，包括X光、B超、核磁共振等。同时也可以帮助影像医生削减读片时间，提升效率，降低误诊的概率，通过提示可能的副作用来辅助诊断。

随着人工智能和医学影像大数据在医学影像领域的逐渐普及和应用，医学影像所面临的准确度和大缺口的问题便可以迎刃而解，两者的融合，将成为医学影像发展的重要方向。

注：本文系动脉网-郝雪阳hxy942416176授权数据观发布，版权著作权属原作者所有，禁止二次转载，如需转载务必申请授权。数据观微信公众号（ID:cbdioreview），欲了解更多大数据行业相关资讯，可搜索数据观（中国大数据产业观察网www.cbdio.com）进入查看。

医学影像大数据与人工智能的“前世今生”