2016年的单细胞转录组数据居然发oncotarget !!!
不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,包括5个栏目:
文献速递(简短介绍,扩充知识面)
文献详解(图文并茂带来大家系统性学习)
R与Bioconductor的技巧(书籍翻译,妙招共享)
scRNAseq的GitHub的书籍翻译(原汁原味的名校教程)
全网第一个单细胞转录组视频教程学习笔记分享
希望大家能有所收获!
现在你看到的是文献速递
单细胞转录组
不过该文章采用的单细胞转录组方法比较不常见,是 single-cell tagged reverse transcription (STRT) ,使用 Fluorescence Activated Cell Sorting (FACS) 挑选细胞,拿到了 75 tumor cells, 18 normal cells and 3 negative control ,平均每个细胞测序数据量是0.38M ,平均成功比对率是64.87%,具体统计信息可以查看Supplementary Table S1. 唯一的过滤标准是表达基因数量要超过3000,这样剩下 67 tumor cells and 7 normal cells。
使用的是HiSeq2000测序仪,Single-end reads of 50bp were generated along with 8-bp index reads corresponding to the cell-specific barcodes.
数据处理使用的是 Tophat 2.0.12 ,NCBI 37.1 assembly, Reads Per Million (RPM) , 很简单,比较奇怪的是基因表达定量他们居然用自己的perl脚本,我感觉很诡异,现成的featureCounts和HTseq居然不用。
差异分析
很明显,作者把差异分析当做了重头戏,而且完全是把单细胞转录组测序数据用传统的bulk转录组分析方法来处理的,比如使用NOISeq包(参数是; “q = 0.999, graphic = “MD”)来找差异表达基因。统计学显著的上调下调基因就去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。
高级转录组数据分析
仍然是传统的bulk转录组分析方法,这里用了Weighted Gene Co-expression Network Analysis (WGCNA),挑选5530高表达变异的基因,得到48个模块,然后集中分析前5个比较大的基因模块,同样也是去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。加多了一个分析,就是在这些模块里面找hub gene,讨论一下这些在膀胱癌的生物学意义即可。 至于WGCNA如何做,看我在菜鸟团博客写的教程即可。
单细胞水平的肿瘤异质性
既然是一个病人的67个肿瘤细胞的单细胞表达矩阵,那么没办法很清晰的分群也很正常,这些细胞的相关系数差异很大 r ~ 0.15 to 0.89,说明了肿瘤异质性。然后仅仅是针对那些高表达量基因 (RPM > 100)来根据coefficient of variation (CV)值来挑选the most 100 variably and most 100 stably 基因集,理所当然的,变化剧烈的那些基因是癌症相关的,表达量稳定的那些基因是housekeeping genes。
意义
The fresh tissues (cancer and normal control specimens from one patient) were minced (5-10mm in maximum dimension) during surgery, and kept in cryopreservation medium (10% DMSO+90% DMEM medium with 30% FBS) under -80°C.
病人其实已经去世了!
The patient died six months after the operation because of intestinal metastasis.
Upregulation of CCND1 was uncovered in various cancers, indicating its potential effects on tumorigenesis process, providing a therapeutic target of this patient.
数据可以重新下载并且分析
数据都在NCBI的SRA数据库:SRP078083 ,查看我在生信技能树的教程就很容易理解: vip.biotrainee.com/d/33
很容易下载样本列表及原始数据,然后自己重新分析:ncbi.nlm.nih.gov/Traces