引入肿瘤分子分型能提供临床分期的预后能力吗

前面的教程 是否所有的癌症的TNM分期都有生存预测意义 ,我们指出来了的 MESO 的ajcc_pathologic_tumor_stage  这个临床指标居然是无法区分生存的,引起了大家的热烈讨论!

天津医科大学的施医生指出来了:

胸膜间皮瘤还是要看病理类型的,他分上皮型,肉瘤型和双向型,其中肉瘤型就是明确的预后不良因素。即使是早期他的预后可能也会比上皮型的晚期差。就像局限期的小细胞肺癌一开始看着比晚期那种大肺腺癌轻。但小细胞一般活不过1年。所以可以试试按病理类型分开再看看。tcga应该有这个数据。还有间皮瘤有个特殊情况就是石棉暴露史。因石棉暴露导致的间皮瘤和正常得的间皮瘤这种病因学的差异也有可能导致这种结果

另外一位杨姓网友留言发表自己的看法:

  • 1.由于间隔淋巴结的复杂性,内皮瘤的N分期参考的是非小细胞肺癌的分期标准,由于两者生物学特性差别较大,因此分期对于判断预后肯定是有误差的。
  • 2.样本量不够。
  • 3.间皮瘤预后极差,中位生存时间仅在一年左右,临床分期不能有效区分预后,同时该疾病进展率不同个体差异较大,可能也存在影响

首先查看MESO 的临床情况

可以看到,确实是有Biphasic和Epithelioid两个亚型:

> table(phe$histological_type,phe$new_stage)
                                      
                                       s1 s2 s3 s4
  Biphasic mesothelioma                 3  3 13  4
  Diffuse malignant mesothelioma - NOS  0  1  2  2
  Epithelioid mesothelioma              6 12 29 10
  Sarcomatoid mesothelioma              1  0  1  0

我们首先看看   Biphasic mesothelioma 内部的stage是否有生存意义 ,代码如下所示:

this_phe=phe[phe$histological_type=='Biphasic mesothelioma',]
survival_dat=this_phe[,c('new_stage','OS','OS.time')]
colnames(survival_dat)=c('group','event','time')
survival_dat$time =  survival_dat$time/365
fit <- survfit(Surv(time, event) ~ group,
               data = survival_dat)
survp=ggsurvplot(fit,data = survival_dat, #这里很关键,不然会报错
                 #legend.title = x,
                 pval = T, #在图上添加log rank检验的p值 
                 risk.table = F, #在图下方添加风险表
                # xlab = "Time in years", #x轴标题
                 #xlim = c(0, 10), #展示x轴的范围
                 break.time.by = 1, #x轴间隔
                 size = 1.5#线条大小
)
print(survp)

出图如下所示:

看   Biphasic mesothelioma 内部的stage是否有生存意义

然后看    Epithelioidmesothelioma 内部的stage是否有生存意义 ,代码如下所示:

this_phe=phe[phe$histological_type=='Epithelioid mesothelioma',]
survival_dat=this_phe[,c('new_stage','OS','OS.time')]
colnames(survival_dat)=c('group','event','time')
survival_dat$time =  survival_dat$time/365
fit <- survfit(Surv(time, event) ~ group,
               data = survival_dat)
survp=ggsurvplot(fit,data = survival_dat, #这里很关键,不然会报错
                 #legend.title = x,
                 pval = T, #在图上添加log rank检验的p值 
                 risk.table = F, #在图下方添加风险表
                 xlab = "Time in years", #x轴标题
                 #xlim = c(0, 10), #展示x轴的范围
                 break.time.by = 1, #x轴间隔
                 size = 1.5#线条大小
)
print(survp)

出图如下所示:

看    Epithelioidmesothelioma 内部的stage是否有生存意义

也就是说,在主要的两个亚型里面,其实stage都无法区分生存。那么这个癌症的临床分期无法区分生存的主要原因应该是出在样品数量太少?或者说病人死的太快了?

接下来群友讨论部分癌症其实是有分子分型的,也引出来了一个很有意思的话题,就是引入肿瘤分子分型能提高临床分期的预后能力吗?

以乳腺癌为例子

在使用gdc客户端命令行工具根据文件 :https://gdc.cancer.gov/files/public/file/PanCan-panimmune_Open_GDC-Manifest_1.txt ,可以下载:

TCGASubtype.20170308.tsv

首先查看其病理分型:

rm(list =  ls() )
library(survminer) 
library(survival)
load(file = 'phe_stage.Rdata')
phe=phe[phe$new_stage != 'other',]
table(phe$type,phe$new_stage) 
tp=unique(phe$type)
tp
phe=phe[phe$type=='BRCA',]
table(phe$histological_type,phe$new_stage)

#          s1  s2  s3  s4 
#  Infiltrating Ductal Carcinoma    140 454 156  17
#  Infiltrating Lobular Carcinoma    23 110  66   1

可以看到主要是Ductal和Lobular起源的乳腺癌,但是我们这个时候想看分子分型。代码是:

sub=read.table('../PanCacner/files/TCGASubtype.20170308.tsv',
               header = T)
head(sub)
sub=sub[sub$cancer.type=='BRCA',]
sub$bcr_patient_barcode = substring(sub$pan.samplesID,1,12)
table(sub$Subtype_mRNA)

Basal   Her2   LumA   LumB Normal 
   193     82    581    219    143

bd=substring(sub$pan.samplesID,14,16)
table(bd)
sub=sub[bd=='01A',]
table(sub$Subtype_mRNA)

Basal   Her2   LumA   LumB Normal 
   192     81    560    212     39 

可以看到,这里面把正常样品表达量矩阵也进行了分子分型,其实呢,我们应该是以病人为单位,进行分子分型!所以我们仅仅是保留01A类型的病人即可:

分子分型

接下来把分子分型信息和病人生存情况合并:

brca_phe = merge(phe,sub,
                 by  = 'bcr_patient_barcode' )
brca_phe=brca_phe[,c('new_stage','Subtype_mRNA',
                     'OS','OS.time')]
table(brca_phe$new_stage,brca_phe$Subtype_mRNA)

Basal Her2 LumA LumB Normal
  s1    25    7  116   25      6
  s2   132   49  292  118     21
  s3    27   20  128   61     11
  s4     3    3    8    5      1

所以接下来我们会做四次生存分析,代码如下所示:

tp=unique(brca_phe$Subtype_mRNA)
tp
brca_subtype_sur_list <- lapply(tp, function(x){
  # x=tp[1]
  this_phe=brca_phe[brca_phe$Subtype_mRNA==x,]
  # 这里先看 os 
  survival_dat=this_phe[,c('new_stage','OS','OS.time')]
  colnames(survival_dat)=c('group','event','time')
  survival_dat$time =  survival_dat$time/365
  fit <- survfit(Surv(time, event) ~ group,
                 data = survival_dat)
  survp=ggsurvplot(fit,data = survival_dat, #这里很关键,不然会报错
                   legend.title = x,
                   pval = T, #在图上添加log rank检验的p值 
                   risk.table = F, #在图下方添加风险表
                   xlab = "Time in years", #x轴标题
                   xlim = c(0, 10), #展示x轴的范围
                   break.time.by = 1, #x轴间隔
                   size = 1.5#线条大小
  )
  return(survp)
})

x=2;y=2
all_plot <- arrange_ggsurvplots(brca_subtype_sur_list,
                                print = F,
                                ncol =x, nrow = y)
all_plot

x=10;y=10
ggsave(all_plot,filename = 'brca_subtype_sur_plot.pdf',
       width = x,height = y)

出图如下:

不同分子亚型内部临床分期都是有生存意义

不过,大家其实可能更想看分子分型本身是否有生存意义,或者前面的 Ductal和Lobular起源的乳腺癌 是否有生存差异!

也是很有意思:

 

总体上来说,这个分子分型还是可以区分生存的,在stage2和stage3以及stage4里面都是 Her2和Basal的病人死得快,符合大家的认知。

这样的组合探索,实在是太多了,  TCGASubtype.20170308.tsv 文件里面的信息很丰富!当然了,分子分型本身就是一个很大的话题了,这个  TCGASubtype.20170308.tsv 文件信息也不一定足够,也可以去看TCGAbiolinks包的数据,参考 : https://www.bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html

HTML R Script 1. Introduction
HTML R Script 2. Searching GDC database
HTML R Script 3. Downloading and preparing files for analysis
HTML R Script 4. Clinical data
HTML R Script 5. Mutation data
HTML R Script 6. Compilation of TCGA molecular subtypes
HTML R Script 7. Analyzing and visualizing TCGA data
HTML R Script 8. Case Studies
HTML R Script 9. Graphical User Interface (GUI)
HTML R Script 10. Classifiers
HTML R Script 10. TCGAbiolinks_Extension

(0)

相关推荐

  • 中国初诊乳腺癌脑转移患者生存结局

    脑转移大约占全部转移部位的7.56%,是乳腺癌患者死亡的重要原因.随着影像学的进步和全身治疗的发展,晚期乳腺癌患者脑转移比例增至30%,一年内死亡比例约为80%.不过,虽然脑转移比例正在增加,但是由于 ...

  • PAM50的概念及分子分型算法原理

    众所周知,癌症具有异质性,在乳腺癌领域,不同亚型的癌症比不同器官来源癌症的差异要大很多.最简单癌症分类,当然是一个基因,比如ER阳性或者ER阴性的乳腺癌患者,并不是说人类有2万多个蛋白编码基因就可以有 ...

  • 肿瘤的分型、分级和分期(转载)

    由于诸多因素的影响,全球恶性肿瘤发病率呈现持续升高态势,据推测到2020年前,全球恶性肿瘤发病率将增加50%,不仅如此,恶性肿瘤的死亡人数也在全球迅猛上升[1],而在我国等发展中国家,这一趋势将更为明 ...

  • 妇科肿瘤 | 子宫内膜癌分子分型

    单纯子宫内膜癌(endometrial cancer, EC)是女性生殖道最常见三大妇科恶性肿瘤之一,发病率及病死率逐年提高且呈年轻化趋势.1983年Bokhman于1983年首次提出子宫内膜癌的&q ...

  • 佳文分享 | 子宫内膜癌分子分型将如何指导未来临床实践?

    2021年1月9日 星期六, 作者:李志刚 2020年开始,不时有专家学者在大会小会上,侃侃而谈子宫内膜癌的分子分型了.可以预见,2021年,讲子宫内膜癌分型者,将风起云涌. 听专家说,目前子宫内膜癌 ...

  • 临床前沿 | 膝骨关节炎分子分型

    来源:南京大学医学院附属鼓楼医院 作者:吕中阳,史冬泉 膝关节骨关节炎(Knee osteoarthritis, KOA)是全球范围内最常见的一种致残性疾病,给家庭和社会带来了巨大的经济负担.南京大学 ...

  • 胃癌分子分型及胃癌 HER2 检测流程与评价标准

    前 言 2018 年,中国临床肿瘤学会(CSCO)更新了肺癌.乳腺癌.胃癌.结直肠癌诊疗指南,新发布了肾癌.头颈肿瘤.甲状腺癌.骨肉瘤.胰腺癌.肝癌.血液肿瘤.食管癌等八个诊疗指南. 我们将原发性胃癌 ...

  • IDH状态和胶质瘤的分子分型

    文章摘要:IDH突变是肿瘤早期发生的现象.目前认为IDH突变是低级别胶质瘤和继发性胶质母细胞瘤(GBM)的重要标记物.加拿大多伦多儿童医院Sameer Agnihotri博士等在2014年12月的&l ...

  • 妇瘤新视野丨分子时代的标志:子宫内膜癌分子分型检查

    <妇瘤新视野>栏目 <妇瘤新视野>栏目是由首都医科大学附属北京妇产医院妇瘤科吴玉梅教授团队与妇产科在线合作推出的精品妇科肿瘤栏目,以典型.疑难或少见的妇科肿瘤疾病的诊断治疗分析 ...

  • 结直肠侧向发育型肿瘤新分型有助于指导治疗方案

    根据内镜下表现的不同,侧向发育型肿瘤(LST)可分为表面有结节的颗粒型(LST-G)及表面平坦的非颗粒型(LST-NG),传统分类将前者分为结节一致型及混合结节型,但是此方法仅仅基于形态学特征,并没有 ...

  • 青云科普 | 马丁医生:乳腺癌分子分型,如何因对?

    上海市抗癌协会乳腺癌青委会  携手"若初"从2020.5.4起推出一档全年共54期的乳腺癌"青云科普"原创专栏.来自上海市22家医院的54位乳腺癌青年专家将从筛 ...