如何用深度学习分辨新冠肺炎与流行感冒?五项研究,从初期筛查到重症病危预测
截止到3月16日,新冠肺炎全国累计确诊81078例,国外累计确诊85133例,国外确诊超国内,COVID-19全球流行已经是不争的事实。
在这场没有硝烟的战场,看不见的战火的杀伤力远比赤身肉搏打仗更让人印象深刻,比如新冠肺炎COVID-19伪装能力极强,处在一线战场的医生很难“一眼”将其和流感准确区分。
首先流感和COVID-19都具有传染性,都会导致呼吸道疾病。典型流感症状包括发热,咳嗽,喉咙肿痛,四肢酸痛,头疼,流鼻涕,鼻塞,疲劳,以及呕吐和腹泻;而新冠肺炎最常见症状是发热,咳嗽和气短,且有5%的患者喉咙肿痛,1-2%的患者会出现腹泻,恶心和呕吐。
也就是说,呼吸道病毒会导致相似症状,因此很难通过症状本身区分COVID-19和流感。
(雷锋网)
能不能从AI的角度来帮助医生找出COVID-19与普通流感的区别?来自世界各地的计算机科学家和机器学习研究人员正在从自己的专业入手,对一些数据集进行编译,并构建AI算法来优化肺炎检测。例如,在数据科学竞赛平台Kaggle上面,已经有了一个COVID-19病例数据集,数据每天更新,内容包括患者年龄、患者居住地、何时出现症状、何时暴露、何时进入医院等等。
(雷锋网 (公众号:雷锋网) )文末给出地址
在CT扫描图方面,也有学者从该疾病的公开研究中提取了可用于分析的几十张图片,包括CT扫描和胸部X射线图像......具体到深度学习算法层面,这些计算机研究员也在为区分流感和COVID-19做了一些努力。在下面的几个研究中,AI研究人员与专业医师联手构建深度学习系统,从肺部区域划分到异常呼吸模式分类器再到病症自动检测都为提高检测COVID-19准确率做着努力。
使用深度学习系统筛查COVID-19
论文:《使用深度学习系统筛查2019新型冠状病毒肺炎》(Deep Learning System to Screen Coronavirus Disease 2019 Pneumonia)
论文链接:https://arxiv.org/ftp/arxiv/papers/2002/2002.09334.pdf
作者来自浙江大学第一附属医院、温州市中心医院、温岭市第一人民医院等机构。
方法:这项工作旨在使用深度学习技术来创建早期筛查模型来利用肺部CT图像区分COVID-19肺炎和甲型流感病毒性肺炎及健康病例。
(a)COVID-19肺炎患者CT图(b)甲型流感病毒性肺炎患者CT图(c)无肺炎感染病例 CT图
作者首先使用三位深度学习模型从肺部CT图像集中分割出了候选感染域,这些分离出来的图像接着被分别划分为COVID-19、甲型流感病毒性肺炎和与感染组无关的病例,并同时使用区域注意力分类模型来计算对应的置信分数。最后,使用噪声函数或贝叶斯函数来计算出CT病例的感染类型和总共的置信分数。
.
(雷锋网)
作者共收集了618个CT样本,包括219个COVID-19患者的CT样本、224个型流感病毒性肺炎患者的CT样本以175个来自健康人员的CT 样本。
结果:在基准数据集上进行实验,结果显示模型在所有 CT 样本的筛查上,准确性达到了86.7%。作用:作者提出的这一方法能够通过深度学习技术完全自动化地筛查COVID-19 病例,而使用区域注意力机制的模型能够更加准确地通过胸片识别出COVID-19病例,准确度高达86.7%,在为一线临床医生提供辅助诊断工具上非常具有前景。
基于深度学习新冠肺炎感染的定量研究
论文链接:https://arxiv.org/abs/2003.04655v2
在论文《用深度学习对COVID-19 CT图像进行肺部感染的定量研究》(Lung Infection Quantification of COVID-19 in CT Images with Deep Learning)中上海市公共卫生临床中心放射科的医生联合上海联合影像研发部的研究人员以及上海大学通信与信息工程学院的博士生用深度学习构建了一个基于深度学习的自动分割和量化系统,针对的目标有两个,一个是胸部CT感染区域,另一个是肺部整体。
方法:训练VB-Net神经网络对CT扫描图像中的COVID-19感染区域进行分割。该系统使用的训练数据集包括249名COVID19 患者,验证集包括300名COVID19患者。另外,为了加快数据标注的速度,其采用了人机回圈(Human-in-the-loop)优化的方法对每个病例进行注解。
注:人机回圈数据处理过程是:人处理的数据,教给机器学习,机器将学习的结果反馈给人工进行校对,持续提升准确率。
再者,为了评估系统的性能以及戴斯相似性系数,研究人员在验证集上计算自动分割结果和手动分割结果之间的体积和感染百分比的差异。
结果:该系统在自动分割和手动分割之间的戴斯相似系数为91.6%±10.0%,感染百分比的平均预测误差在验证集上的表现为0.3%,这意味着与通常需要1~5个小时的“全人工划分区域”相比,人机回圈在3次模型更新后可将“划分”时间减少到4分钟左右。
用深度学习进行新冠肺炎自动检测和患者监控
论文链接:https://arxiv.org/abs/2003.05037v1
在论文《针对COVID-19的快速AI开发周期:用深度学习CT图像分析得到自动检测的初步结果和病人监控的初步结果》(Rapid AI Development Cycle for the Coronavirus (COVID-19) Pandemic: Initial Results for Automated Detection & Patient Monitoring using Deep Learning CT Image Analysis)中美国的 AI 医疗影像公司 RADLogics联和温州医科大学台州医院的放射科以及美国纽约西奈山医院用深度学习算法开发了自动CT图像分析工具。
方法: 采用了多个国际数据集,中国疾病感染地区也包括在内,其中测试集包含来自中国、美国的157名患者。所采用的方法的基础是现有稳健的2D和3D深度学习模型,将其与与临床理解结合起来对模型进行修改和调整。
结果:
在中国患者的数据集上,每项胸部CT研究中冠状病毒与非冠状病毒病例的分类结果的AUC为0.996,其中特异度为92.2%,敏感度为98.2%。对于冠状病毒患者的时间分析,系统输出能够对较小的不透明物,例如体积,直径等进行定量测量,并在基于切片的“热图”中也能够可视化较大的不透明物。综上,该工具在检测冠状病毒阳性患者以及量化疾病负担方面有着非常高的精度。
使用异常呼吸模式分类器大规模筛查COVID-19患者
论文:《异常呼吸模式分类器可能有助于大规模筛查感染COVID-19的病患,准确且不声不响》(Abnormal respiratory patterns classifier may contribute to large-scale screening of people infected with COVID-19 in an accurate and unobtrusive manner)
论文链接: https://arxiv.org/abs/2002.05534v1
作者来自华东师范大学、教育部人工智能重点实验室、加拿大瑞尔森大学、上海疆莱数据科技有限公司。
方法:作者利用深度相机和深度学习来准确、远程且不声不响地检测出人的异常呼吸模式。这一方法面临的挑战有二:一是现实世界的数据量不足以训练获得深度模型;二是不同类型的呼吸模式的类内变异较大、类外变异较小。
作者针对实际呼吸信号的特点,首次提出了一种新的、有效的呼吸模拟模型(RSM),以降低训练需要的数据量大与真实数据量少之间的矛盾。
与此同时,他们还应用了具有双向和注意机制的GRU神经网络(BI-AT-GRU)对6种具有临床意义的呼吸模式(呼吸正常、呼吸急促、呼吸缓慢、间停呼吸、潮式呼吸和中枢性呼吸暂停)进行分类。
BI-AT-GRU 模型对呼吸模式进行分类结果:通过深度相机测量的实际数据对所得到的BI-AT-GRU 的性能进行测试,结果表明,该模型能对6种不同的呼吸模式进行分类,准确率、精度、召回率和F1得分 分别为94.5%、94.4%、95.1%和94.8%。并且在对比实验中,其得到专用于呼吸模式分类的 BI-AT-GRU模型要优于现有的最新模型。
用机器学习模型预测重症Covid-19 患者的病危程度
论文:《使用3个临床特征预测重症Covid-19 感染患者的病危程度:采用武汉临床数据的基于机器学习的预后模型》(Prediction of criticality in patients with severe Covid-19 infection using three clinical features: a machine learning-based prognostic model with clinical data in Wuhan)
论文链接: https://www.medrxiv.org/content/10.1101/2020.02.27.20028027v2
作者来自华中科技大学人工智能与自动化学院、机械科学与工程学院,华中科技大学同济医学院附属同济医院急诊科、麻醉科、信息管理部,华中科技大学无锡研究院和武汉理工大学信息科学与工程学院。
方法:作者筛选了自2020年1月10日至2月18日同济医院收治的2799位患者的电子档案。出院患者共计375位,其中包括201位重症患者。他们创建了一个基于 XGBoost机器学习算法的预后预测模型,并测试了29位在2月19日以后确诊的患者(包括来自其他医院的3名患者)。
XGBoost机器学习算法流程图结果:375位患者的平均年龄为58.83岁,男性比例为58.7%。发热是最普遍的最初症状(49.9%),随后是咳嗽(13.9%)、疲劳(3.7%)和呼吸困难(2.1%)。
该模型从 300 多个特征池中识别出了3个主要的临床特征,即乳酸脱氢酶(LDH),淋巴细胞和超敏 C反应蛋白(hs-CRP)。
这一临床路径非常易于检查、能够准确、快速地评估死亡风险。因而,这一方法具有重要的临床意义。
作用:作者创建的这一基于3项指标的预后预测模型,能够预测死亡风险,并能够提供从重症病例中识别关键病例的临床路径。该模型能够帮助医生及早发现病患的病症并及早干预,从而有效降低死亡率。
部分数据集下载:
https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset
https://github.com/ieee8023/covid-chestxray-dataset/blob/master/README.md?fbclid=IwAR30yTGBr55WXdCngCoICDENHycmdL2bGwlvl1ckdZM-ucjGH10Uakz7khk
。