单细胞转录组探索CAFs的功能和空间异质性

写在前面

你现在看到的是文献俱乐部2019年笔记分享第一弹,我将会在春节7天连续分享,目录如下:

  • 2019年1月份第1周(总第49周)单细胞转录组探索CAFs的功能和空间异质性

  • 2019年1月份第2周(总第50周)异常CRC病人的突变时空异质性与免疫

  • 2019年1月份第3周(总第51周)探索PDAC癌前病变

  • 2019年1月份第4周(总第52周)TCGA计划的ATAC-seq数据发布

  • 2019年2月份第1周(总第53周)胃癌类器官

  • 2019年2月份第2周(总第54周)测173个成年人的大脑的102个基因

  • 2019年2月份第3周(总第55周)2.5万汉族人的GWAS乳腺癌风险基因

因为学业需要,我阅读的大量文献都是NGS组学相关,所以会涉及到很多数据处理,而这些文献基于的生物信息学数据处理技巧,我都在过去的5年里以各种形式分享讲解过,也有系列视频,希望你可以在方便的时候再次学习一遍,查漏补缺。

也欢迎推荐给有需要的朋友

学习笔记目录

1.3个学生的linux视频学习笔记

2.生信人应该这样学R语言系列视频学习心得笔记分享

3.一万人陪你学习GEO数据库挖掘知识(公益视频听课笔4.记分享)

5.公共数据库挖掘视频学习心得体会

6.生信小技巧系列第一季完结版视频教程学习笔记分享

……期待有你……

如果,你不仅仅是对NGS组学应用文献感兴趣,也欢迎加入我们文献阅读小组分享自己的主页领域文献。

逆向收费读文献社群(第二年通知)

今天是大年初一,给大家带来的是单细胞转录组探索CAFs的功能和空间异质性,希望你能学到知识。

文献概要

癌相关的成纤维细胞 CAFs,具有异质性,是TME中的重要细胞成分,分泌的特定细胞因子、炎症趋化因子及其它可溶性因子能够诱导减缓细胞循环的过程,从而影响肿瘤细胞的增殖;2018年12月的NC文章:Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing 使用成熟的单细胞转录组( Smart-seq2 )手段探索了癌相关的成纤维细胞 CAFs的功能和空间异质性。

Here, we use the highly sensitive Smart-seq2 protocol to delineate the heterogeneity of 768 CAFs isolated from the genetically engineered MMTV-PyMT mouse model of breast cancer

名词背景

  • single cell RNA sequencing

  • Cancer-associated fibroblasts (CAFs) / tumor-supportive CAF

  • extracellular matrix (ECM)

  • epithelial-to-mesenchymal transition (EMT).

  • MMTV-PyMT mouse model

  • a negative selection fluorescence-activated cell sorting (FACS) strategy

  • the negative selection markers EpcamPecam1, and Ptprc

  • to isolate an EpCAM−/CD45−/CD31−/NG2− cell fraction devoid of epithelial cells, immune cells, endothelial cells, and pericytes, respectively

  • Smart-seq2 protocol

  • External RNA Controls Consortium (ERCC) spiked in

  • principal-component analysis (PCA)

  • t-distributed stochastic neighbor embedding (t-SNE)

  • single cell differentially expressed genes (SCDE)

  • reproducibility-optimized test statistic (ROTS)

  • differentially expressed genes/significantly differentially expressed (SDE)

  • log2(RPKM + 1)

  • PAM50 proliferation metagene

  • METABRIC cohort

  • The Cancer Genome Atlas (TCGA) database

  • six commonly used mesenchymal cell markers

  • endothelial cell metagene in breast tumors

CAFs 的背景知识

细胞来源

  • resident fibroblasts

  • bone marrow-derived mesenchymal stem cells

  • pericytes

  • malignant cells or endothelial cells

cellular markers

  • α-smooth muscle actin (SMA)

  • fibroblast-specific protein 1 (FSP-1/S100A4)

  • fibroblast activation protein (FAP)

这些背景知识在文章的introduction部分有介绍:

)

根据相应的分子标记,就可以特异性的分选CAFs进行研究:

单细胞分群及定义

主要分析是tSNE,然后挑选first 150 SDE genes绘制热图 - 并且进行 gene ontology (GO) 注释来确定不同组的细胞功能:

  • Population 1 vascular CAFs (vCAFs). 细胞数量最多

  • Population 2 were named matrix CAFs (mCAFs).

  • Population 3 cells were termed cycling CAFs (cCAFs). 是vCAFs过渡阶段

  • Population 4 developmental CAFs (dCAFs).

如下:

可以挑选一些有确切生物学意义的基因可视化它们在这些不同群细胞的表达量分布情况:

既然很明确的分成4组,那就可以进行差异分析,挑选差异基因绘制热图:

同样的是GO分析注释细胞亚群的功能:

值得注意的是: cCAFs represent the proliferative segment of vCAFs 所以最后作者认为是3群细胞,如下图:

其中:vCAF marker Nidogen-2, the mCAF marker PDGFRα, and the dCAF marker SCRG1,这个很重要,需要仔细看作者是如何分析的。

第4群细胞也很特殊,高表达 PyMT , 说明它是肿瘤相关细胞了。

它们3群细胞的ECM相关基因表达模式差别很明显。

6个公共基因集

包括:

  • EC metagene (CDH5, CXorf36, TIE1)

  • Microvasculature

  • Stroma 1

  • Stroma 2

  • ECM metagene (COL1A1COL1A2COL3A1)

  • Proliferation

主要是结合TCGA这样的公共数据库:

还有在METABRIC数据库的:

还有在一篇文章的:

单细胞转录组

数据是公开的: GSE111229 代码也是有的: GitHub [www.github.com/KPLab/SCS_CAF].

其ngs测序数据的处理方式也是在methods有详细描述,很容易follow一遍。

首先单细胞数据需要根据一定的指标进行过滤:

最后作者得到的表达矩阵可以直接在GEO数据库里面现在,这样没有服务器的小伙伴就可以在此基础上面走下游分析流程。

关于metagene

每个分组的细胞都有特定的基因集,比如作者分析的top 150的DEGs,也可以通过算法局限到一个基因,就是metagene,看看这个在临床分组的表现情况:

后记

如果你完全没有看懂文章说了些什么,却仍然坚持到了最后,说明你有可能对生物信息学感兴趣,你缺乏的是一个入门的契机!

也欢迎推荐你身边的朋友参与我们的线下培训,如果有缘的话

全国巡讲

生信技能树(爆款入门培训课)全国巡讲约你

生信技能树(爆款入门培训课)巡讲第一站-重庆

生信技能树(爆款入门培训课)全国巡讲免费大放送-赶快告诉你导师吧

……未完待续……

(0)

相关推荐