这5个miRNA组成的肺鳞癌诊断基因集在tcga数据库能复现吗
最近看到某公司宣传他们的科研服务产品,是miRNA的芯片,而且文章居然是2011发表的,那个时候我还不知道生信是啥子。(我一直以为自己足够老了)
60+88个肺鳞癌病人肿瘤组织和癌旁的miRNA芯片表达矩阵,数据集在:GSE15008 芯片是 CapitalBio 平台 (CapitalBio Corp.) ,包含 924 mature mam- malian microRNA probes (including 677 human micro- RNA sequences)(现在miRBase数据库收录了1917条pre-miRNA(前体),以及2656条成熟的miRNAs。见:http://www.mirbase.org/ ) 使用主成分分析和支持向量机建模,拿到 minimal 5- element classifier (hsa-miR-210, hsa-miR-182, hsa-miR- 486-5p, hsa-miR-30a, and hsa-miR-140-3p) 可以很好的区分normal和tumor。 生存分析发现:high expression of hsa-miR-31 was associated with poor survival 分析hsa-miR-31 的靶基因,并且实验验证其中3个:DICER1, PPP2R2A, and LATS2,最后定位到DICER1 30-UTR
首先,两个队列的人群地域差异 其次,miRNA芯片和miRNA测序技术差异 还有,肿瘤组织和癌旁配对问题,两个组数据量问题
cox(可做单因素和多因素)
TCGA的cox模型构建和风险森林图lasso回归
用lasso回归构建生存模型+ROC曲线绘制随机森林
听起来很霸气用起来并不难的随机森林支持向量机
听起来很霸气用起来并不难的 支持向量机
赞 (0)