【胸部放射学】能谱CT影像组学特征鉴别肺癌结节与炎性结节的价值
文章来源:中华放射学杂志, 2020,54(12) : 1167-1172
作者:郁义星 王希明 张妤 诗涔 胡粟 朱默 胡春洪
通信作者:胡春洪,Email:sdhuchunhong@sina.com
目的 探讨能谱CT影像组学特征在鉴别肺癌结节与炎性结节中的价值。
方法 回顾性分析在苏州大学附属第一医院接受肺部能谱CT扫描的96例肺癌结节和45例炎性结节患者的资料。按照2∶1的比例随机分配为训练组(肺癌结节64例,炎性结节30例)和验证组(肺癌结节32例,炎性结节15例)。利用MaZda软件对训练组动脉期和静脉期70 keV单能量图像进行影像组学特征提取。采用费希尔参数法(Fisher)、分类错误率联合平均相关系数法(POE+ACC)和相关信息测度法(MI)对提取的特征进行筛选,得到3 组最优特征子集。然后用线性(LDA)和非线性判别分析法(NDA)对最优特征子集进行分析,计算其鉴别肺癌结节和炎性结节的受试者操作特征(ROC)曲线下面积(AUC)、准确率、灵敏度、特异度、精准率和F1分数。利用人工神经网络(ANN)建立预测模型,并对验证组两种病变进行鉴别。使用Delong检验比较不同的最优特征子集AUC的差异。
结果 在动脉期,MI‑NDA法选择的最优特征子集鉴别训练组肺癌结节和炎性结节的AUC最高,为0.888(95%可信区间0.806~0.943),其准确率、灵敏度和特异度分别为88.3%、87.5% 和90.0%。MI‑NDA 法与Fisher‑NDA、(POE+ACC)‑NDA 法的AUC 差异无统计学意义(Z=1.941,P=0.052;Z=1.683,P=0.092)。在静脉期,(POE+ACC)‑NDA 法选择的最优特征子集的AUC 最高,为0.846(95% 可信区间0.757~0.912),其准确率、灵敏度和特异度分别为87.2%、92.2% 和76.7%。(POE+ACC)‑NDA 与MI‑NDA 的AUC差异无统计学意义(Z=1.354,P=0.18),而与Fisher‑NDA的AUC差异有统计学意义(Z=2.423,P=0.015)。MI‑NDA法选择的动脉期最优特征子集在训练组和验证组的AUC最高,分别为0.888(95%可信区间0.806~0.943)和0.871(95%可信区间0.741~0.951)。
结论 能谱CT影像组学定量特征可用于鉴别肺癌结节与炎性结节,具有较高的诊断价值。
资料与方法
一、临床资料
回顾性分析2015年9月至2018年9月在苏州大学附属第一医院放射科接受肺部能谱CT扫描的141例患者的资料。根据病理结果,将其分为肺癌结节组96例[男56例, 女40例;中位年龄62(25,75)岁]和炎性结节组45例[男25例,女20例;中位年龄48(30,68)岁]。纳入标准:(1)肺结节直径均<3 cm;(2)均接受CT双期能谱成像(gemstone spectral imaging, GSI);(3)所有肺结节均接受手术切除,并有明确的病理结果。排除标准:(1)图像伪影较大,影响分析;(2)术前接受过新辅助放化疗。96例肺癌结节中,腺癌70例,鳞癌16例,小细胞癌10例;长径为(2.5±1.8)cm;CT表现为实性结节62例,磨玻璃结节34例。45例炎性结节中,20例为机化性肺炎,15例为炎性肉芽肿,10例为慢性炎症伴纤维组织增生;长径为(2.3±1.6)cm;CT表现为实性结节的35例,磨玻璃结节的10例。
141例患者按照2∶1的比例以随机种子法分配为训练组和验证组,其中训练组94例,肺癌结节64例,炎性结节30例;验证组47例,肺癌结节32例,炎性结节15例。
本研究经苏州大学附属第一医院伦理委员会的批准(伦理编号:2020伦研批第150号),免除患者知情同意。
二、仪器与方法
采用美国GE Discovery CT750 HD CT机行胸部扫描。先行常规胸部平扫,增强扫描采用能谱CT GSI,螺旋扫描速度为0.6 s/周,螺距为1.375,探测器宽度为0.625 mm×64,电压为高低能量(140 kVp和80 kVp)瞬时高速切换,管电流约为600 mA,CT剂量指数为12.72 mGy。增强扫描为双期动态扫描,对比剂采用碘佛醇(含碘320 mg/ml,江苏恒瑞医药股份有限公司)80~120 ml(1.5 ml/kg),注射流率为3 ml/s。动脉期扫描开始时间为注射对比剂后30 s,静脉期开始时间为动脉期结束后30 s。采用两组重建模式,重建出两组70 keV单能量图像,第1组的层厚和层距均为5 mm,第2组层厚和层距均为1.25 mm。将第2组图像导入MaZda软件(Version 4.6,http://www.eletel.p.lodz.pl/mazda/)进行影像组学分析。
三、影像组学分析
利用MaZda软件对训练组肺癌结节和炎性结节动脉期和静脉期70 keV单能量图像进行影像组学分析。(1)图像均一化处理:选择MaZda软件中μ±3σ(其中μ为图像灰度值的平均值,σ为图像灰度值的标准差)进行图像灰度均一化处理,最大限度地减少对比度和明亮度对图像灰度值的影响。(2)CT图像分割:2名放射科医师选择病灶最大层面的图像手动勾划病变感兴趣区域(region of interest,ROI),ROI尽可能包括整个病灶。其中20例肺癌结节图像分别由5年和8年工作经验的医师分割并评估观察者间的差异,之后再由8年工作经验的医师再分割1次评估观察者内的差异。所有图像的分割数据集由8年工作经验医师第1次分割的20例和剩余121例的数据组成。(3)影像组学定量特征提取:利用MaZda软件提取肺结节双期70 keV单能量图像的定量特征,包括灰度直方图、绝对梯度、灰度共生矩阵、灰度游程矩阵、自回归模型和小波变换等特征。(4)特征选择:利用MaZda软件提供的3种特征选择方法:费希尔参数法(Fisher coefficients,Fisher)、分类错误率联合平均相关系数法(classification error probability combined average correlation coefficients, POE+ACC)和相关信息测度法(mutual information, MI)对提取的定量特征进行筛选, MaZda软件自动选择出10个最优的特征参数,得到3组最优特征子集。(5)特征数据分析:使用MaZda软件中的B11模块提供的线性判别分析法(linear discriminant analysis,LDA)和非线性判别分析法(nonlinear discriminant analysis,NDA)对3组最优特征子集进行判别分析,计算出其鉴别肺癌结节和炎性结节的受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve, AUC)、准确率、灵敏度、特异度、精准率和F1分数,再利用最优特征子集建立人工神经网络(artificial neural network,ANN)预测模型,利用建立的预测模型,对验证组肺癌结节和炎性结节进行鉴别诊断。
四、统计学方法
采用SPSS 20.0软件进行统计分析。对两名医师手动分割病灶及同一名医师前后两次手动分割病灶使用组内相关系数(intraclass correlation coefficient,ICC)进行一致性分析,ICC>0.75为一致性较好。采用MedCalc15.6.1计算最优特征子集的AUC, 并使用Delong检验比较不同的最优特征子集AUC的差异,以P<0.05为差异有统计学意义。
结 果
一、影像组学最优特征子集在鉴别训练组肺癌结节与炎性结节的效能
两名医师对病灶进行手动分割的一致性较好,观察者内和观察者间ICC分别为0.85和0.88。
利用MaZda 软件提取训练组肺癌结节(图1~6)和炎性结节(图7~9)动脉期和静脉期70 keV单能量图像定量特征,共301个。3种特征选择方法Fisher、POE+ACC 和MI对提取的定量特征进行筛选,得到肺癌结节和炎性结节动脉期和静脉期3 组最优特征子集(表1)。
在动脉期3 组最优特征子集中,MI‑NDA法选择的最优特征子集鉴别肺癌结节和炎性结节的AUC最高,为0.888[95% 可信区间(confidence interval, CI) 0.806~0.943],高于(POE+ACC)‑NDA (AUC=0.846) 和Fisher‑NDA(AUC=0.811),但差异无统计学意义(Z=1.683, P=0.092;Z=1.941,P =0.052)。而MI‑NDA 法与MI‑LAD(Z=4.486,P<0.001) 、Fisher‑LDA (Z=4.841,P<0.001) 和(POE+ACC)‑LDA 法(Z=4.129,P<0.001)的AUC值差异均有统计学意义(表2)。在静脉期3组最优特征子集中,(POE+ACC)‑NDA法的AUC最高,为0.846(95%CI 0.757~0.912),其与MI‑NDA差异无统计学意义(Z=1.354,P=0.18),而与Fisher‑NDA(Z=2.423,P=0.015)、MI‑LAD(Z=3.642,P<0.001)、Fisher‑LDA(Z=4.030,P<0.001)、(POE+ACC)‑LDA法(Z=4.957,P<0.001)的AUC值的差异均有统计学意义(表2)。
二、影像组学最优特征子集预测模型在训练组和验证组中的诊断效能评估
将前3个AUC最大的动脉期和静脉期最优特征子集利用ANN构建预测模型,在验证组动脉期Fisher‑NDA、(POE+ACC)‑NDA、MI‑NDA 诊断肺癌结节和炎性结节的AUC 分别为0.789(95%CI 0.645~0.894) 、0.838 (95%CI 0.701~0.929) 、0.871 (95%CI 0.741~0.951) ;静脉期(POE+ACC)‑NDA、MI‑NDA、Fisher‑NDA 诊断肺癌结节和炎性结节的AUC 分别为0.822(95%CI 0.683~0.918)、0.740(95%CI 0.591~0.857)、0.706(95%CI 0.555~0.830)。MI‑NDA法选择的动脉期最优特征子集在训练组和验证组的AUC最高。
图1~6 右肺上叶后段腺癌患者的CT图像及直方图。图1为动脉期70 keV单能量图像示右肺上叶后段1枚不规则结节影,长径约2.1 cm,边缘可见分叶征和棘突征;图2为使用MaZda图像分割工具在动脉期图像上手动勾画病灶兴趣区,提取动脉期影像组学特征;图3为右肺上叶结节动脉期兴趣区的灰度直方图,反映病变灰度的分布情况;图4为静脉期70 keV 单能量图像示右肺上叶后段结节与邻近血管关系密切;图5为使用MaZda图像分割工具在静脉期图像上手动勾划病灶兴趣区,提取静脉期影像组学特征;图6为右肺上叶结节静脉期兴趣区的灰度直方图 图7~9 右肺上叶胸膜下炎性结节的CT图像及直方图。图7为动脉期70 keV单能量图像示右肺上叶胸膜下1枚不规则结节影,长径约1.5 cm,边缘可见分叶征和毛刺征;图8为使用MaZda图像分割工具在动脉期图像上手动勾画病灶兴趣区;图9为右肺结节动脉期兴趣区的灰度直方图
表1 训练组肺癌结节和炎性结节动脉期和静脉期3组最优特征子集
注:Fisher:费希尔参数法;POE+ACC:分类错误率联合平均相关系数法;MI:相关信息测度法;DifVarnc:差分方差;Teta4:参数4;Contrast:对比度;Vertl_RLNonUni:游程长度不均匀性(垂直方向);GrKurtosis:绝对梯度峰态;Correlat:相关度;AngScMom:角二阶矩;Entropy:熵;InvDf‑Mom:逆差矩;45dgr_RLNonUni:游程长度不均匀性(45°方向);Sigma:参数
表2 动脉期和静脉期最优特征子集鉴别训练组肺癌结节和炎性结节效能对比
注:AUC:曲线下面积;Fisher:费希尔参数法;POE+ACC:分类错误率联合平均相关系数法;MI:相关信息测度法;LDA:线性判别分析法;NDA:非线性判别分析法
讨 论
影像组学方法可将影像图像转化为高维度的影像定量特征数据,可以更全面地定量描述肿瘤异质性,能够弥补传统定性诊断的不足。本研究初步探讨了能谱CT 70 keV单能量图像影像组学特征在鉴别肺癌结节与炎性结节中的价值,结果显示MI‑NDA法选择的动脉期最优特征子集在训练组和验证组的AUC最高,分别为0.888和0.871。表明能谱CT单能量图像影像组学特征在鉴别肺癌结节与炎性结节中有较大的应用价值。
本研究中,3种特征选择方法和两种数据分析方法的不同组合所得到的诊断效能均不同。如在动脉期,MI‑NDA法选择的最优特征子集鉴别肺癌结节和炎性结节的AUC 为0.888,高于(POE+ACC)‑NDA (AUC=0.846) 和Fisher‑NDA (AUC=0.811) 。而MI‑LDA、(POE+ACC)‑LDA 和Fisher‑LDA 的AUC 值仅为0.675、0.698 和0.652。这提示NDA的诊断价值优于LDA,如张竹伟等研究结果也表明在鉴别乳腺良恶性病变中,NDA比LDA更有效,误判率更低。因此,在影像组学研究中,应该选择合适的特征提取和数据分析方法。
多项研究表明,影像组学分析可以定量评估肺癌结节与炎性结节内部纹理特征不同,从而做出鉴别诊断。如Tu等回顾性分析374例患者的薄层CT图像,提取了23个影像组学特征,并用此特征预测肺结节良恶性,AUC值高达0.80,其预测效能低于本研究中的MI‑NDA 法(训练组AUC=0.888;验证组AUC=0.871)。上述研究的影像组学分析是建立在常规CT图像基础上,并利用平扫肺部CT图像进行影像组学分析。本研究利用动脉期和静脉期双期能谱CT单能量图像进行影像组学分析,提取的影像组学特征更丰富,信息量更大,对于模型的构建更有价值。
研究表明,70 keV单能量图像的CT值最接近120 kVp混合能量图像,而单能量图像具有更低的图像噪声和更高的对比噪声比。国内外学者在肺部能谱CT研究中,多选用70 keV单能量图像,认为可以达到图像质量和辐射剂量的双向平衡。如Hou等利用70 keV单能量图像的CT值来鉴别肺癌与炎性肿块,Zhang等利用70 keV单能量图像CT值净增值来鉴别孤立性肺结节的良恶性。因此,本研究选择70 keV 单能量图像进行影像组学分析。
本研究存在一些局限性:(1)样本量偏小,研究结果是初步的,还有待于大样本,多中心研究进一步补充;(2)影像组学分析在二维水平进行,以后将进一步研究基于三维CT 图像的影像组学分析;(3)仅研究了影像组学特征在鉴别诊断中的价值,未考虑临床特征及定性影像特征的预测价值;(4)本研究的主要目的是鉴别肺癌结节和炎性结节,因此,并未将其中的实性结节和磨玻璃结节分开进行研究,在后期的工作中,会对此进一步研究。
综上所述,能谱CT单能量图像影像组学定量特征可用于鉴别肺癌结节与炎性结节,具有较高的诊断价值。
参考文献(略)