启帆医学专注于SCI量身定制,SCI免费评估、 SCI翻译润色、SCI发表协助;职称/硕博论文写作;科研课题标书设计撰写。如果有需要,您可以随时和我联系~~
题目:Construction and Validation of a 9-Gene Signature for PredictingPrognosis in Stage III Clear CellRen
译名:预测Ⅲ期透明细胞肾癌预后的9基因信号的构建与验证
目的
建立一个多基因信号,以帮助更好地III期肾细胞癌(RCC)患者的预后进行预测。
★从GEO数据库中下载GSE53757数据集,包括14对癌症和正常组织的表达数据,从TCGA数据库中下载16对mRNA,表达谱数据(下载的是RNA-seq测序数据,需要提取mRNA数据)。
★差异表达分析,对共同差异表达基因进行进一步分析。
★对TCGA中选择肾癌Ⅲ期病例 (N=122)进性lasso cox回归,筛选和建立预后多基因信号。在FUSCC数据库中选择肾癌Ⅲ期病例(N=77)对多基因信号进行验证。
★对所有病例(N=199)预测总体生存时用C-index和time-dependent ROC检验多基因信号的有效性。
1.TCGA和GEO两个数据集中共找到1370个差异表达基因。2. Lasso cox 回归模型找到9个mRNA,构建分类器将肾癌III期病人分为高风险组和低风险组,在TCGA患者(N122)中、FUSCC患者 (N=77)中、以及TCGA和FUSCC所有患者(N = 199)中预后差异非常显著(p<0.01)。3.对完整数据(N=199)进行多因素cox比例回归,发现9个基因信号分类的风险组、诊断时的年龄、pNstage、ISUP grade为总体生存的独立的预后因子。肾癌是全世界最常见的泌尿系肿瘤之一,2018年美国估计有近65 340例新病例和14 970人死亡。肾细胞癌的发病率(RCC)在中国也在增加。目前,预后预测主要是根据RCC患者的病理分期。目前,临床上推荐采用肿瘤转移(TNM)分类系统进行肿瘤分期。然而,各亚组之间存在看明显的生存差异。四型肾感患者(T3NOM0,5年生存率:20-70%;T1-3N1MO,5年生存率:0-20%)(5)。虽然UICC/AICC TNM分期系统的最新版本(第8版)已经发布,但这个问题仍然存在,未解决,从而限制了该系统在判断预后方面的应用,以指导临床实践。因此,需要有更好的信号来帮助预测III期肾癌患者的预后。此外,III期RCC患者的全身治疗仍在发展中。几项研究声称,在手术后接受索拉非尼或舒尼替尼的III期患者有更好的疗效。与安慰剂相比,无疾病生存期(DFS),但总生存期(OS)相似。据报道,PazopanibNivolumumab在转移性RCC患者中有效,局部晚期肾癌患者的辅助治疗安慰剂没有显示出保护作用。佐剂和新佐剂nivolumab临床试验仍在进行中,但希望它们能显示出良好的效果。ipilimumab的使用也可能是有希望的。因此,建立更准确的III期肾癌患者预后分类系统,对指导更好的管理策略具有重要意义。TCGA数据库(通过UCSU-Xena下载)level3 mRNA数据,16对肾癌III期患者癌症和癌旁组织样品。●TCGA中122例肾癌III期患者有完整的临床和生存信息,训练集。FUSCC数据库中77例接受根治性肾切除术的患者,验证集。●共研究就199名肾癌III期患者基因表达数据和临床信息。★GEOquery包下载芯片数据、gcrma包对数据进行标准化.★探针ID转换为EntrezGenelD,多个探针匹配到一个EntrezGenelD,取均值。★对GEO数据使用paired t-test识别差异基因,并用FDR矫正p-value,p-value < 0.01并且[logFC|>1为差异表达基因、TCGA数据做同样分析(也可以用limma包),取共同差异表达基因。在FUSCC验证集中提取77名患者的总RNA,进行RT-PCR,以ATCB基因作为内参基因,ACt表示基因的表达水平,△Ct(A gene)= Ct(A gene) - Ct(ATCB gene),Ct值越大表示模板的初始浓度越低,也就是gene的表达量越低。所以△Ct值越高,初始表达量越低。data of surgery to the date of deathlasso cox 回归(R-glmnet包)对差异表达基因进行筛选,减少差异表达基因的数量,并且得到筛选后的基因的回归系数。☉根据筛选后的基因的表达量和患者总生存时间,通过X-tile软件,对筛选后的每个基因分别寻找最佳cutoffs。
☉然后根据各自cutoffs,将筛选的基因分为高表达基因和低表达基因,一般高表达基因用1表示,低表达基因用0表示。
☉根据每个基因的回归系数与表达状态(高/低表达)计算每个患者的风险得分,使用风险得分中位数将患者分为高风险组和低风险组。
使用KM法验证高风险组和低风险组的患者生存时间是否有差异,生存信息来自TCGA数据库患者和FUSCC数据库患者,分别对训练集(TCGA) 验证集(FUSCC),整合数据(TCGA + FUSCC)进行生存分析。Time dependent ROC:在每个数据集中评估风险得分的预测准确度。科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
踌躇满志无限期
扬帆起航正当时