这篇10分顶刊把病理图像玩出新高度!

题目:非裔美国人前列腺切除术后前列腺基质复发的计算机衍生基质特征的图像signature

一. 研究背景

数据显示,在前列腺癌根治术后,有30%-40%的前列腺癌患者出现复发。尽管有证据表明在非裔美国人(AA)患者中存在独特的,更具侵略性的前列腺癌表型,但是现有的用于复发风险预测的临床模型并未考虑到肿瘤表型基于特定人群的变异。因此作者研究了肿瘤内基质数字化测量、人群特异表型,创建改进的模型来预测根治性前列腺切除术后的复发的能力。

二. 分析流程
三. 结果解读
1. 患者数据集的临床病理特征。

表1提供了患者数据集的临床和病理特征。总共334例接受了前列腺癌根治术的前列腺癌患者被确定包括在本研究中。BCR(生化复发)的平均时间约为3年,最后一次随访的平均时间约为5年。全部队列的患者手术时大约60岁。通过Wilcoxon秩和检验没有发现测试集和验证集中临床或人口统计学特征的分布差异。

表1:全数据集的临床病理特征摘要

补充图S2中提供了CONSORT式流程图,描述了患者信息的处理流程:在三个不同的机构进行手术程序和样品制备,每个样本都经过泌尿生殖系统的病理检查,用数字标注了代表性的癌变区域,用于本研究的定量组织形态学检查(图1A)。

使用先前基于卷积神经网络开发的深度学习方法对核核基质进行分割(图1B)。其模式是输出置信度图,图像中每一个像素点是基质中核的一部分的可能性(图1C和D)。对这些概率图进行阈值处理,并用于计算基质图像特征(图1E和F)。基质形态描述符用于训练预后模型(图1G),该模型可预测BCR风险评分(图1H)。

图1:数据集准备,分析和预后模型的构建。

2. 实验1:基质形态的描述子与生化复发有关

作者将患者分为三组(VT,V1,V2),VT用于模型训练和特征挖掘,V1和V2则用于独立的预后验证模型性能。作者使用单变量COX回归在VT中评估每个基质图像特征对BRFS(无生化复发生存)的预后能力,以确定哪些特征可能适合进行风险预后模型的构建。

在数据集VT总体(VT,AA+CA)中,有15个不相关(PCC <0.90)的基质图像特征可预测BRFS的预后基于Cox的比例风险回归分析。这些特征包括组织纹理,核形状和核排列的定量描述。在AA队列(VT,AA)中,六个特征显著预后预测。在CA训练队列(VT,CA)中,则有22个。

值得注意的是,虽然在AA队列(VT,AA)中预后预测较少,AA特有的特征在风险比上表现得比其他队列的特征更加突出。此外,VT,CA和VT AA+CA中的重要特征包括多种特征类型(形状,方向,排列和纹理),在VT,AA中发现的只是形状和纹理的描述符。

补充表S6中列出了每个种族队列中所有特征在每个BCR和非BCR患者之间的显著差异分布,并展示了其中位数

3. 实验2:基质形态学signature(AAstro)可预示AA患者的生化复发

作者使用基质图像特征值构建随机森林(RF)和ENC模型以估计BCR风险。这些模型以患者的图像特征值向量为输入,并输出患者复发风险的估计值。

对VT进行10次迭代的3倍交叉验证,对RF的描述符进行了测试。对训练队列,产生最高统计学显著Cox比例危险回归HR的超参数。在使用训练集进行模型参数优化之后,在整个模型上对模型进行训练,然后针对V1和V2验证。每个验证实验都计算了AUC值,并绘制KM生存曲线,同时应用单变量COX回归确定HR和P值。

作者还进行了基于组织形态学特征的Elastic Net-penalized Cox比例风险回归(ENC)估计BRFS时间。这些模型适合于生存数据。作者使用以下算法确定最佳风险评分阈值,以分层低复发风险和高复发风险的患者:

(i)使用ENC模型为训练集中的每位患者获得风险评分。

(ii)保留20%和80%百分位数之间的风险分数作为候选阈值

(iii)每个候选值在训练集中被作为阈值进行检验,同时计算log rank P 值和HR

(iv)保留具有统计学显著性的候选阈值,并选择与最大HR对应的值。

在参数优化和阈值确定之后,针对验证集V1和V2测试模型。

在两个验证集(V1,V2)中,针对AA患者的RF和ENC模型对AA患者的复发风险有预测作用。对于这些患者,使用生存数据拟合的ENC模型优于在二进制BCR /非BCR signature上训练的ML模型。补充表S1中列出了每种训练和验证队列组合的分类实验结果,图2A和B显示了AA患者的结果。

针对AA患者的最佳RF模型,即AAstroML,已通过单变量HR确定了最重要的六个基质图像特征。这些特征都是基质核形状和基质纹理的描述(补充表S3中列出了特定特征)。AAstroML在验证集V1 AA中达到了AUC 0.85和HR 3.03,在V2,AA上的AUC为0.75,HR为4.51。

针对AA患者的最佳ENC模型AAstroENC接受了10个基质形态学描述符的训练(补充表S3)。所选择的特征与AAstrML所选择的特征相似,但还包括两个核排列的描述符。V1 AA的AUC为0.87,HR为4.71,V2 AA的AUC为0.77,HR为5.7,在两个数据集中,均优于AAstroML。

AAstro模型选定的特征的分布在图2D-F中可视化。Kaplan-Meier曲线估算每个验证集中每个分类器的估计高复发风险组和低复发风险组的相对生存率。

图2:验证数据集中的分类器性能以及可对AA患者进行预后的特征分布。

4. 实验3:对于AA病人,AAstro signature独立于临床变量且优于临床诺模图。

为了确定AAstroENC是否独立于临床变量,作者使用模型评分以及临床和病理变量来拟合多变量Cox比例风险模型。可见,AAstroENC在V1 AA和V2 AA均与现有风险评估模型中使用的临床和病理变量无关,是独立的预后因素(表2)。

表2:针对临床和病理变量进行调整的AAstroENC模型评分的多变量Cox比例风险建模。

调整其他变量和精囊浸润(SVI)的AAstroENC敏感性时,只有两个变量在两个验证数据集中均保留了显著的HR。

为了评估AA特异性,自动基质特征(AAstro)模型相对于常规金标准的性能,采用CAPRA-S和Kattan绘制术后复发风险预后诺模图。可见AAstroENC和AAstroML在两个验证数据集中均优于临床模型。在AA验证队列中,唯一提示预后的列线图是V1 AA中的Kattan列线图。Kattan列线图获得的HR低于AAstroENC。补充表S2提供了使用CAPRA-S 和Khttan诺格图为AA患者创建的模型的性能,补充表S3提供了针对CA患者的等效模型。

5. 实验4:基质形态与肿瘤生物标志物表达的关系

为了确定是否有基质图像特征与肿瘤生物标志物的表达水平相关联,计算每个生物标志物-基质特征对的PCC值和相关P值。PCC绝对值大于0.4具有统计学显著性(P <0.05)。

鉴定出29对IHC衍生的生物标志物和基质形态描述符有显著相关性(PCC> 0.4或PCC <-0.4)。其中三对包括可预测VT AA数据集中BRFS的基质形态描述符:分别位于具有细胞质RB的基质核形状平均分形维数(PCC = 0.606,P = 0.0005),具有TMPRSS2-ERG融合蛋白的基质质地Haralick均值信息量度1(PCC = -0.447,P = 0.033),和AR表达的基质核形状平均分形维数(PCC = 0.41,P = 4.12e-4)。

发现PTEN与从基质计算出的15个图像特征有关。所有这些描述符都是核形状的测量值。PTEN是与大多数基质图像特征相关的标记,在统计学上与15个特征相关。QH特征-生物标志物与最高绝对PCC配对的是PTEN与基质核形状的平均傅立叶描述符4的关联(PCC = -0.623,P = 7.56e-3)。

在图3A中概述了所研究的生物标志物,在图3B中突出显示了具有显著相关性的选定对。图3C-E中展示了描述预后基质图像特征与生物标志物表达值之间关系的散点图。

图3:基质形态描述符与生物标志物表达水平的关联。

小结

本文的目的在于评估根治性前列腺切除术预后的基质形态和特定人群调整的定量指标。作者从常规H&E玻片上计算了基质形态的定量描述子,发现AA和CA患者之间的基质形态有所不同。在两个独立的验证数据集中,发现使用作者的基质形态特征创建的模型对AA病人是预测良好的模型。这些模型中,AAstroML和AAstroENC可以独立于常规临床变量预测风险,并且优于AA验证集患者的当前临床规范指标。多个基质图像特征也与使用IHC测量的肿瘤生物标志物的表达水平相关。

(0)

相关推荐