你要的rmarkdown文献图表复现全套代码来了(单细胞)
有了生物信息学数据分析,生命科学领域研究从此大不一样,不再是玄学。而且很多高质量的CNS文章,还好把配套文章的图表的数据和代码全部开源。比如前些天我们公布了唐医生推荐的《这个20G的单细胞项目数据和代码的压缩包有什么(python数据分析典范)》,很多粉丝表示从来没有想过居然需要学python,不是说好的基于R语言的统计可视化吗?
强烈要求我们推荐纯粹的R语言的文献图表复现全套代码,其实很容易检索到,2020奶牛7月仅仅是单细胞高分(IF>9)文章就有一百多篇,全部的单细胞相关文章有六七百篇了。一般来说,公布代码,都是在GitHub,所以只需要关键词合适,搜索十几篇带有配套文章的图表的数据和代码很正常。
我从这些CNS文章里面精挑细选了一个非常值得大家花时间跟下去的,就是新鲜出炉的发表在CELL杂志的:Therapy-Induced Evolution of Human Lung Cancer Revealed by Single-Cell RNA Sequencing 。全套代码在:https://github.com/czbiohub/scell_lung_adenocarcinoma
而且是以rmarkdown形式组织的条理清楚,目录如下:
01_Import_data_and_metadata.Rmd
02.1_Create_Seurat_object_neo_osi.Rmd
02_Create_Seurat_object.Rmd
03.1_Subset_and_general_annotations.Rmd
03_Merge_in_NeoOsi.Rmd
03_Subset_and_general_annotations.Rmd
IM01_Subset_cluster_annotate_immune_cells.Rmd
IM02_immune_cell_changes_with_response_to_treatment.Rmd
IM03_Subset_cluster_annotate_MFs-monocytes_LUNG.Rmd
IM04_Subset_cluster_annotate_T-cells_LUNG.Rmd
IM05_Immune_cells_across_pats_with_multiple_biopsies.Rmd
IM06_Combine_Immune_and_nonImmune_annotations.Rmd
NI01_General_annotation_of_nonimmune_cells.Rmd
NI02_epi_subset_and_cluster.Rmd
NI03_inferCNV.Rmd
NI04_Cancer_cells_DEgenes.Rmd
NI05_Annotation_of_Nontumor_epi.Rmd
NI06_mutation_analysis.Rmd
NI07_TH226_cancercell_analysis.Rmd
NI08_Gene_expression_plotting.Rmd
NI09_AT2_sig_compare.Rmd
NI10_TCGA_clinical_outcomes.Rmd
NI14_qpcr_analysis.Rmd
NI15_multiplex_IF_analysis.Rmd
NI16_cancercell_EGFR_ALK.Rmd
NI16_regression_analyses.Rmd
NI17_cancercell_PDsigs.Rmd
V01_various_small_plots.Rmd
每个步骤都清清楚楚,主要是是单细胞基础10讲相关内容而已:
01. 上游分析流程 02.课题多少个样品,测序数据量如何 03. 过滤不合格细胞和基因(数据质控很重要) 04. 过滤线粒体核糖体基因 05. 去除细胞效应和基因效应 06.单细胞转录组数据的降维聚类分群 07.单细胞转录组数据处理之细胞亚群注释 08.把拿到的亚群进行更细致的分群 09.单细胞转录组数据处理之细胞亚群比例比较
还有一些个性化汇总。文章的主线就是分群,然后继续分群。细胞数量也不多,大家的电脑基本上都可以hold住,第一次分群如下:
第二次分群,就是细化每一个亚群进行深入讨论,这就是这篇文章的主要图表啦,所以大家完全不用担心看不懂它。
如下你想看懂它们,毫无疑问,你的R语言需要过关。自己想办法把R的知识点路线图搞定,如下:
了解常量和变量概念 加减乘除等运算(计算器) 多种数据类型(数值,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习
我们也可以解析每个代码
每个人写代码的习惯不一样,而且有更好的rmarkdown书写方式,大家都可以运行一遍作者提供的数据和代码,在他们的基础上面进行创作和发挥:
---
title: "关于批次效应矫正后出现负值"
author: "YuanSH"
date: "8/13/2020"
output:
html_document:
theme: cerulean
toc: true
# toc_depth: 2
toc_float:
true
---
<!-- <font color=#e8505b>**non-biological factors**</font> -->
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```