试一下我的差异分析软件

我本身是不喜欢把差异分析这种需求包装成软件的,甚至它都算不上软件。当然,我也很不太喜欢写软件(需要考虑太多的用户意外),不过,总有一天我还是得面对。为什么让大家试一下我的 `差异分析软件` ,其实是想通过这个例子,告诉大家什么是软件,什么是参数,什么是中间态。下载差异分析脚本wget  https://raw.githubusercontent.com/jmzeng1314/my-R/master/DEG_scripts/run_DEG.Rwget  https://raw.githubusercontent.com/jmzeng1314/my-R/master/DEG_scripts/tair/exprSet.txtwget  https://raw.githubusercontent.com/jmzeng1314/my-R/master/DEG_scripts/tair/group_info.txtRscript ../run_DEG.R -e exprSet.txt -g group_info.txt -c 'Day1-Day0' -s counts  -m DESeq2如果是转录组的raw counts数据,就选择 -s counts,如果是芯片等normalization好的表达矩阵数据,用默认参数即可。下面是例子:# Rscript run_DEG.R -e airway.expression.txt -g airway.group.txt -c 'trt-untrt' -s counts -m DESeq2# Rscript run_DEG.R -e airway.expression.txt -g airway.group.txt -c 'trt-untrt' -s counts -m edgeR# Rscript run_DEG.R -e sCLLex.expression.txt -g sCLLex.group.txt -c 'progres.-stable'# Rscript run_DEG.R -e sCLLex.expression.txt -g sCLLex.group.txt -c 'progres.-stable' -m t.test对于转录组的raw counts数据,有DEseq2包和edgeR包可供选择。对于芯片等normalization好的表达矩阵数据,有limma和t.test供选择。是不是很简单呀,你现在就可以用这个脚本去测试你自己的数据啦,当然你需要按照下面的规则准备输入矩阵和分组信息!!制作表达矩阵

第一列是基因ID,后面的列是各个样本。其中第一行尤为注意,最开头是一个空格(了解R里面read.table函数原理)制作分组矩阵dexSampleNamecellSRR1039508untrtGSM1275862N61311SRR1039509trtGSM1275863N61311SRR1039512untrtGSM1275866N052611SRR1039513trtGSM1275867N052611SRR1039516untrtGSM1275870N080611SRR1039517trtGSM1275871N080611SRR1039520untrtGSM1275874N061011SRR1039521trtGSM1275875N061011记住这个文件的第一列要跟上面的表达矩阵的样本名对应!!!只有第一列是需要看的,其余的无所谓。根据分组信息,是需要自己指定比对信息的,比如上面的分组矩阵,需要指定 -c 'trt-untrt'假设你把这个 run_DEG.R 添加到了环境变量,是不是就是我们通常使用的生物信息学软件呢?一般来说挑选好了对表达矩阵的normalization方法就决定了选取何种差异分析方法,也并不强求弄懂统计学原理,它们都被包装到了对应的R包里面,主要是对R包的学习。edgeR (Robinson et al., 2010)DESeq / qDESeq2 (Anders and Huber, 2010, 2014)DEXSeq (Anders et al., 2012)limmaVoomCuffdiff / Cuffdiff2 (Trapnell et al., 2013)PoissonSeqbaySeq那么为什么一定要进入到R里面自己一步步的了解代码原理才能做差异分析呢?

(0)

相关推荐