深度学习判别新冠肺炎准确率达九成,《Radiology》已收录相关研究成果

从武汉封城记起,仅仅一周后,各家企业针对新冠肺炎开发的肺部人工智能辅助算法便陆续研发完毕,并登陆了包含武汉市中心医院、武汉协和医院在内的最前线医院。

但从功能上来说,在疫情之中,许多AI的职能更多在于帮助医生审阅来自患者的CT影像,捕获其肺部的异常区域,但难以进一步区分肺炎患者究竟是患的哪一类肺炎。

这是一个非常有趣的问题,它关乎到影像学能以怎样的能力为人类发现如新冠这样的传染病。过去已有研究人员将深度学习用于处理小儿胸部X光片,其结果正是这项技术可用于检测和区分感染细菌性和病毒性肺炎的儿童。而在CT领域,尚无学者对相关问题拿出大样本有效性研究的试验结果和高质量论文。

从这个问题出发,许多学者开始了自己的研究,有的尝试从肺段入手,借助不同肺炎的肺段参数差异判断肺炎的种类;有的尝试联合病原学,将病原学结果与影像结果一一对应……近日,一篇完全基于肺部CT影像的深度学习判别新冠肺炎的论文《Artificial Intelligence Distinguishes COVID-19 from Community Acquired Pneumonia on Chest CT》被国际顶级放射学期刊《Radiology》所接收,这篇文章使用的算法似乎在寻觅新冠肺炎的CT影像学特征方面找到了窍门。

简单地说,这一研究是一次针对于新冠肺炎患者CT影像的回顾性研究,研究人员构建了一种特定的3D检测神经网络,并将其用于检测4356例CT数据。结果显示,该算法对新冠肺炎的鉴别灵敏度和特异性分别高达89.76%和95.77%,受试者工作特征(ROC)曲线下面积(AUC)为0.96。

这篇论文由医疗AI影像企业科亚医疗携手国内六家医院共同研究发表。科亚医疗是国内首个人工智能三类医疗器械注册证获证企业,一直专注于大数据和人工智能技术在医疗领域的落地应用,其获证产品“深脉分数”更是获得了国家药监局“具有重大的经济效益和社会价值“的定调评价。与国内外同类CTFFR产品相比,“深脉分数”各项指标均处于国际领先水平。

科亚医疗告诉动脉网:“本篇论文的意义在于首次使用基于深度学习的技术,对胸部CT影像进行新冠肺炎(COVID-19),社区获得性肺炎(CAP),及非肺炎(Non-pneumonnia)的三分类研究,并获得了令人兴奋的结果。在这之前,有学者进行了在二维X-ray胸片上肺炎分类的研究,而在三维CT肺部图像上肺炎的分类还是空白。而此次在全国乃至全球抗击新冠肺炎时期,我们科亚医疗构建的深度学习神经网络COVNet,从肺部CT中提取各类影像特征用于鉴别新冠肺炎,并且通过热力图的方式对模型做出决策的重要区域进行可视化,来说明模型识别的关键病变区域。

通过多中心医院的数据验证,COVNet网络模型对COVID-19,CAP和非肺炎的检测都有较高的灵敏度和特异性。而对COVID-19的检测,ROC下曲线面积高达0.96. 本论文开启了基于深度学习技术的肺部CT影像肺炎多种类分类的研究,对像COVID-19,SARS,MERS等传染性肺炎,提供了一种快速AI影像筛查方式的思路,希望能为全球抗击新冠肺炎抛砖引玉。”

实验设计与模型建立

本次研究采集了来自六家医院3506位患者,总计4536次三维胸部CT检查影像。在排除造影CT检查与单张切片厚度大于3mm的检查后,研究构建了一个包含3322名患者,总计4356项三维胸部CT检查影像的数据集。这些患者的平均年龄为49±15岁,其中男性1838名,女性1484名。在这个数据集中,感染COVID-19的患者影像有1296例(30%,均通过RT-PCR检查确认为阳性);感染社区获得性肺炎(CAP)的患者影像1735例(40%);非肺炎的患者影像1325例(30%)。

所有检查数据均按9:1的比例随机分为患者的训练集和独立测试集。然后将训练数据集进一步按9:1的比例拆分用以训练模型和内部验证。独立测试集未用于训练和内部验证。

为了减少实验出现偏差的可能性,这些数据分属于六家不同的医院,同时将收录时间控制于2016年8月16日至2020年2月17日,其中COVID-19部分仅使用采集于2019年12月31日至2020年2月17日间的数据。

由于不同医院使用的CT设备厂家存在差异,所以本次实验所用的影像均从DICOM文件导出,所有CT切片厚度控制在0.5mm至3mm之间,图像矩阵大小为512*512,图像分辨率大小在0.29*0.29mm2到0.98*0.98mm2之间。

Fig.1:算法流程图

Fig.1是本论文算法的整体流程图,主要包含四个步骤:

第一步,模型训练和测试数据库的构建。按照上述数据介绍进行处理。

第二步,是数据集的预处理,包含数据增广和肺部区域的分割。本论文采用基于U-Net架构的网络进行肺部区域的分割,以便去除非肺区域对后续检测算法的影响。

第三步,将预处理后的数据集输入到COVNet网络进行深度学习算法的训练。

第四步,对独立测试集进行预处理(肺部区域提取),输入到第三步中训练好的COVNet模型中进行预测分类。

科亚医疗将这个用于检测COVID-19的3D深度学习框架命名为COVNet。这一卷积神经网络以Resnet50为主干,能够从输入CT影像中同时提取2D局部和3D全局代表性特征图(如Fig.2)。COVNet使用最大池化层和全连接层来综合分析这些特征图,最终产生每种类型(COVID-19,CAP和非肺炎)的概率评分。

Fig.2:新冠肺炎检测神经网络COVNet框架图

COVID-19:新冠肺炎;CAP:社区获得性肺炎;Non-Pneumonia:其他非肺炎

统计与结果

统计数据显示,将COVNet应用在工作站(GPU NVIDIA Quadro M4000 8GB,RAM 16GB和Intel Xeon Processor E5-1620 v4 @ 3.5GHz)上,每次CT检查肺炎预测所耗费的平均时间为4.51秒,远远快于医生单个CT影像组阅片速度。

而在检测准确度方面,算法对于COVID-19检测的灵敏度和特异性为90%与96%;对于CAP检测的灵敏度和特异性为87%与92%;而对于非肺炎影像,算法的灵敏度和特异性为94%与96%。检测结果详见Table1。

Table1:深度学习框架COVNet在独立测试集上的性能

为了提高模型的可解释性,科亚医疗采用梯度加权类激活映射(Grad-CAM)方法,实现推动深度学习模型决策重要区域的可视化。以下三张图片(Fig.3a,Fig.3b,Fig.3c)分别以区域热图的方式展示了COVID-19、CAP与非肺炎三种情况之下,引导深度学习算法作出决策的区域。

通过这种方式,我们能够很轻易地了解深度学习关注的影像特征,而这些影像特征给研究人员具体研究COVID-19影像特性指出了明确的方向。

Fig.3a COVID-19预测输出热图,红色突出显示与预测类别相关的激活区域

 

Fig.3b CAP预测输出热图,红色突出显示与预测类别相关的激活区域

 Fig.3c 非肺炎预测输出热图

局限性与发展方向

肺部许多疾病的影像特征存在大量重叠,这些疾病取决于患者年龄、药物反应性、免疫状态、潜在疾病合并症等宿主因素,仅凭胸部CT的影像学表现,很难区分所有肺部疾病。

另外,本研究目前仅对COVID-19进行了分类预测,尚未对感染程度进行分类。科亚医疗表示:“接下来我们将尝试将试验进一步细化,在预测COVID-19存在的同时,去预测患者感染的严重程度,以帮助医生进一步监测、治疗、管理患者。”

科亚医疗的研究具备足够的创新性,其临床应用将在提高基于CT图像诊断新冠肺炎准确度的同时,帮助临床医生及早确诊感染患者,大幅提升一线医生诊断效率,优化新冠肺炎筛查流程,实现高效精准筛查、降低医生工作强度,合理分配医疗资源的作用。

正如一位医生所说:“影像科的医生偏好于给予‘占位性病变’的判断,而很少诊断为肺炎。但对于患者而言,占位性病变的内容太过宽泛,他们需要更为精确的判断,这种判断现在很少来源于影像科。如今,很多人工智能都在处理数据做定量分析,但这些工作并非人工智能的专长——常规数据处理软件也能收集挖掘数据。所以,AI要想发挥出真正的价值,需要借助于定量的数据给出定性的判断结果。”

科亚医疗在探索未知的AI潜力中走出了珍贵的一步,影像科到底能够发挥怎样的作用,还需AI公司进一步用深度学习探索像素之中的未知,答案或许便隐藏在点与点之中。

对该公司感兴趣的机构请联系融资助手小云:DongMai_Investent

长按识别下方二维码,了解更多科亚医疗的企业信息。

文 | 赵泓维

近期推荐

★  数字化CRO已成大势所趋?上游企业为何能值400亿?

★  被误解与被遮蔽的:民营医疗抗疫实录

★  2020年MIT十大突破性技术中的医疗科技进展,及20多家医疗健康企业盘点

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

全力奔跑就是我们的浪漫

(0)

相关推荐