转录组分析

2024-07-31 09:29:31

原标题：20个必须知道的转录组知识点！

随着测序成本的不断下降，转录组测序分析已然成为生物学及医学研究不可或缺的技术手段。

但是，对于大多数初学者来说，会遇到各种各样的问题。这里，小编就给大家重点介绍一下转录组测序分析的相关知识。

Question and Answer

1、什么是转录组测序？

转录组广义上指在某一生理条件下，细胞内所有转录组产物的集合，包括：mRNA、ncRNA、rRNA等；狭义上指所有mRNA的集合。

转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和，主要包括mRNA和ncRNA。

转录组具有时间特异性、组织特异性、空间特异性等特点。

2、无参转录组和有参转录组的区别？

如果所研究的物种有组装注释质量较好基因组序列，且和该基因组序列比对效率较高，那么可以采用有参转录组的分析策略，直接进行分析。反之，则需要按照无参转录组的分析策略进行转录本组装，构建unigene库，然后进行后续分析。

3、普通转录组测序适用于哪些情况？

普通转录组测序主要适用于两大类：一是不同的生长阶段或者发育过程；二是不同的环境、药物、病原菌等逆境胁迫处理。

4、转录组测序推荐的测序数据量？

转录组测序所需数据量与所研究物种的基因组大小有关，基因组越大，则所需数据量越大。按照我们的经验来说：

常规物种一般建议6G数据即可；

基因组较大的物种推荐8G以上数据，比如：小麦建议10G数据起，甘蔗、甘薯建议至少8G数据。

5、转录组测序的取样建议？

取样要遵守三个原则：代表性和一致性原则、迅速性原则、低温原则。

6、转录组测序必须做生物学重复么？需要几个重复？

生物学重复是生物实验所必须的，转录组测序也不例外，至少3 次生物学重复。

准备生物重复样品时，通过对实验的预先设计和控制，尽可能将与实验处理无关的背景条件控制在同一水平，减少批次效应对结果的影响。

7、转录组测序可以同时测到mRNA、lncRNA、micRNA以及circRNA么？

我们通常所讲的转录组测序只能测到mRNA。但是全转录组测序通过构建两个测序文库(一是小RNA测序文库、二是lncRNA测序文库)是可以测到以上4种RNA的。

8、有参转录组测序分析中，与参考基因组的比对效率多高才能够满足后续分析？

与参考基因组的比对效率与多个因素有关，包括基因组组装质量、测序质量、有无污染等；一般来说，与参考基因组的比对效率在70%以上时，该基因组可以满足后续的分析需求。当比对效率低于60%时，需要考虑换参考基因组或者按照无参转录组分析策略进行分析。

9、所研究物种有参考基因组时，必须按照有参的来分析么？

按照有参或者无参进行转录组分析，取决于基因组的质量、所研究物种与参考基因组的比对效率。具体如下：

若参考基因组质量较差，则可以选择按照无参转录组分析策略进行分析；

若所研究物种与参考基因组比对效率比较低，则需要按照无参转录组分析策略进行分析。

10、做完转录组之后一定要进行Q-PCR验证么？一般验证多少个差异基因合适？

目前来说，Q-PCR验证是转录组测序分析必不可少的补充验证实验，发文章必须。一般验证15-20个差异基因比较合适。

11、Q-PCR与转录组测序结果的吻合度一般多高是合适的？为什么会出现不吻合的现象？

Q-PCR与有参转录组分析结果的吻合度在80%以上；Q-PCR与无参转录组分析结果的吻合度在70%以上。

出现结果不吻合现象的原因如下：实验所用样本弄混；没有使用与转录组测序同一批的样本进行Q-PCR验证；挑选的基因表达量较低或差异不显著。

12、转录组测序的后续补充分析有哪些？

做完转录组测序可以考虑以下分析内容做为补充，用于提高文章档次和深度。

可变剪接的深入分析(对生信基础要求较高)

基因家族分析

WGCNA分析

其他分析(参考其他人的高分文章，整理自己的个性化分析思路)

13、有参转录组测序分析的结果文件中有全部基因的cds序列么？在哪个文件中？

一般来说结果文件中有全部基因的cds序列。我公司有参转录组分析结果中的基因cds序列信息位于Gene_Func_Anno文件夹下面的NewGene中的All.longest_tran.fa文件里。

14、转录组测序分析常用的数据库有哪些？重点关注哪些注释信息？

Nr：NCBI非冗余蛋白数据库，包含的信息很全面, 注释到的基因较多。

COG ：中文释义即“同源蛋白簇”。COG 分为两类，一类是原核生物的，另一类是真核生物。原核生物的一般称为 COG 数据库；真核生物的一般称为 KOG 数据库。

SWISS-PROT：经过注释的蛋白质序列数据库，数据库中的蛋白质的功能经过了试验验证，注释是精确的；

TrEMBL：数据库全称“Translation of EMBL”，是从EMBL中的cDNA序列翻译得到的，其中TrEMBL收录的是未经人工注释的编码DNA序列翻译数据；

KEGG：翻译成中文是京都基因与基因组百科全书，是一个整合了基因组、化学和系统功能信息的数据库，旨在揭示生命现象的遗传与化学蓝图。它是由人工创建的一个知识库，KEGG数据库最优的地方在于拥有描绘已知通路的代谢通路图。另外KEGG中有一个“专有名词”KO(KEGG Orthology)，它是蛋白质(酶)的一个分类体系，序列高度相似，并且在同一条通路上有相似功能的蛋白质被归为一组，然后打上KO(或K)标签，一般用字母K后面加5个数字表示。KEGG_ID 是pathway的ID，表示方法是2-4个字母，后面跟上5个数字；

GO(gene ontology)：是基因本体联合会(Gene Onotology Consortium)所建立的数据库，旨在建立一个适用于各种物种的，对基因和蛋白质功能进行限定和描述的数据库。按照三大类别BP(生物学过程)、 MF((分子功能)、CC(细胞组分)对基因的产物-蛋白质进行了分类，并能随着研究不断深入而更新的语言词汇标准。在GO数据库中，本质上是一个有向无环图的数据结构，在三大类别之下，又有小的分类层级，一层一层的分类下去。对于某个具体的GO号来说，代表一组同源蛋白，拥有相似的结构和功能；

Pfam：是一个被广泛使用的蛋白家族数据库，它有两个数据库，高质量，手工确定的Pfam-A，自动注释的Pfam-B数据库。

15、差异分析的筛选标准默认是多少？是固定不变的么？

差异分析的筛选标准默认为：Fold Change≥2且FDR<0.01。筛选条件要灵活，要根据情况进行参数调整，数据是死的，人是活的，要灵活变通。

16、unigene和转录本的区别？

unigene是转录本的子集。首先通过triniy组装出来的视为转录本，然后挑选最长的一条转录本作为unigene。

17、差异基因太多，注释信息太杂乱，怎么挑选目标基因？

可以根据KEGG和GO富集分析结果，挑选富集程度较高的代谢通路和GO terms，进而查看相关的差异基因；

对不同的差异组合进行维恩图分析，挑选共有或者特有的差异基因作为后续的研究对象；

根据前人的文献报道，挑选相关差异基因，不要局限在自己研究的物种上。

18、为什么原核物种只能做有参转录组分析？

由于原核生物的基因组中存在大量基因重叠区域、操纵子及多顺反子，如果按照无参转录组分析策略进行组装的话，难度较大，组装结果存在较大风险。

19、差异基因数目多少比较合理？

不同的处理，不同的研究目标，差异基因的数目是不同的，从几十个到几千个都有可能。但是如果差异基因数目是个位数或者上万，那么就需要和分析人员沟通一下，查一查是否有问题。

20、看不懂转录组结果怎么办？

我们专门针对初学者，我们精心制作了配套的《转录组分析结果解读教程》，专门讲解转录组每个分析内容的原理及结果每个文件夹、每个文件、每个表头及每个图片的生物学意义，确保您能看懂分析结果，需要学习课程的请复制下方链接，进入观看。

课程链接：

有参转录组结果解读课程：https://study.163.com/course/courseMain.htm?share=2&shareId=400000000234009&courseId=1004723037&_trace_c_p_k2_=130a3a736bad41e9b4e07fe45c4bb1c6；

无参转录组结果解读课程：https://study.163.com/course/courseMain.htm?share=2&shareId=400000000234009&courseId=1005207017&_trace_c_p_k2_=ccf5f3eec4cf432dae068fed45da0053

21、不会深入挖掘转录组数据怎么办？

读懂了转录组数据结果，还需要一些技能帮助我们深入挖掘数据，如：挑选目标基因、做venn图、通路注释、转录组因子调控分析、绘制热图、蛋白互作图等等，假如您还不会这些技能，可以参考课程：《转录组标准分析后的数据挖掘》，就可以学习以上技能。

课程链接：《转录组标准分析后的数据挖掘》：https://study.163.com/course/courseMain.htm?share=2&shareId=400000000234009&courseId=1005084024&_trace_c_p_k2_=6f43697cc76e425a984e4b976943ea18返回搜狐，查看更多

责任编辑：

明码标价之转录组常规测序服务

前面我们开通了明码标价专栏: 都是公共数据的处理,其实也同步给了全部的代码,也算是一种粉丝福利吧!因为我们一直在面向数据的教程服务,确实没有自己的实验室没有自己的测序仪,所以对很多粉丝的测序要求只能说 ...
技术贴 | 微生太宏基因组报告解读（开篇）

本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读宏基因组由来: 微生物世界是分子多样性最大的天然资源库,基于菌株水平的传统分离培养技术为人们认识微生物多样性提供了可 ...
mapman 植物基因功能分析神器！（mapman系列之一）

mapman 植物基因功能分析神器!(mapman系列之一) 说在前头作为一个老牌的专门针对植物学研究开发的通路分析的软件,mapman,似乎在当前大多数组学分析的流程中被忽略,而只能在相对少数文 ...
我的生信之路2

写下前面: 现在已经是19年了,年底也快到了,各地的会议也在朋友圈此起彼伏.想想我做生物信息也三年了.故事总在发展着,去年我总结了我的生信之路,写了我是如何开始做生信的.今天我将为大家带来新的一年来的 ...
使用clusterProfiler进行GO、KEGG富集分析（有参情况）

寻找差异表达的基因并识别它们的功能,是我们进行RNA测序的最主要目的.很明显,这些差异的基因必然与功能改变密切相关,例如,比较患病个体与正常个体的组织表达谱,不难想到这些显著失调的基因参与了生物学过程 ...
【科研】转录组测序数据分析

引言前面两期主要为各位简单介绍了转录组测序以及转录组测序的方法,相信各位对转录组测序有了一定的了解.那么测序后进行数据分析,具体包含哪些分析内容呢?本文就详细为各位介绍一下. 分析内容 mRNA是具 ...
技术贴 | 宏转录组专题 | 盘点宏转录组分析方法

本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读宏转录组宏转录组测序是对某一特定时期.特定环境样品中的全部微生物的RNA进行高通量测序,直接获得该环境中所有微生物 ...
技术贴 | 微生太宏基因组报告解读 | 第五篇：EggNOG、CAZy、CARD等7大数据库助力宏基因组功能分析

本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读环境样品中的微生物物种种类多,培养难度大,而且很多是功能未知的微生物,因此与一般的动植物组学相比,微生物组学研究难度 ...
底裤价转录组产品线（还送数据分析培训）

for NGS, we only do RNAseq forever 最近,我们生信技能树五年前的直播编程活动的一个优秀学员找到了我,希望可以合作, 他依托这些年在各大科研服务公司工作经历,开始创业了 ...
科研│BIOL PSYCHIAT：自闭症谱系障碍性别差异的神经转录组分析:当前观点和未来方向

编译:微科盟伊一,编辑:微科盟景行.江舜尧. 微科盟原创微文,欢迎转发转载. 导读自闭症谱系障碍(ASD)在男性中的诊断频率是女性的3到5倍,这是一种显著的性别偏见患病率,表明性别差异参与了生物因 ...
科研│PLANT J: 全球转录组分析揭示了拟南芥剪接事件的昼夜节律控制

编译:微科盟 Nicole,编辑:微科盟景行.江舜尧. 原创微文,欢迎转发转载. 导读拟南芥的昼夜节律控制着许多生理和分子过程,使植物能够预测其环境的每日变化.然而,mRNA水平变化如何与共转录/转 ...
科研│中国林业科学研究院：核桃胚胎的转录组分析揭示了脂类生物合成和多不饱和脂肪酸代谢的关键发育阶段和相关基因（国人佳作）

编译:微科盟伊一,编辑:微科盟景行.江舜尧. 原创微文,欢迎转发转载. 导读核桃是一种广泛栽培的木本油料树种,其胚富含多不饱和脂肪酸.迄今为止,核桃胚胎发育过程中油脂生物合成的途径和必需基因仍不清楚 ...
科研│J AGR FOOD CHEM：转录组分析揭示高CO2处理后柿子中碳水化合物代谢对不同乙醛生产能力的影响（国人佳作）

编译:澜粒粒,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读大多数品种的柿子果实在发育过程中可溶性单宁酸的持续积累,导致涩味.大多数商品化品种和天然种质均为涩型,因此去除可溶性单宁酸对于食用柿 ...
科研│NAT CELL BIOL：中国医学科学院和剑桥大学|单细胞转录组分析追踪移植后造血干细胞的分化

编译:刘娟,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读由于技术的限制,移植后的造血干细胞(HSCs)在预条件性宿主体内定位后的行为尚未被研究.本文利用单细胞RNA测序,首先获得28种造血细 ...
科研│BIOTECHNOL BIOFUELS：比较转录组分析两种不同生长速率的杨树基因型之间的基因和基因模块差异（国人佳作）

编译:伊一,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读背景:木材为全球生物燃料生产提供了重要的生物质资源.树干的径向生长对于林业和生物燃料的生物量生产至关重要,但从基因上剖析是有挑战性的, ...
科研 | SCI TOTAL ENVIRON：酪丁酸梭菌过表达吸氢酶基因的转录组分析（国人佳作）

编译:寒江雪,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读酪丁酸梭菌(Clostridium Tyrobuyricum)是一种有前途的生产生物燃料的微生物.本研究发现酪丁酸梭菌中过表达吸氢酶 ...
科研 | PLANT MOL BIOL：转录组分析揭示玉米体细胞胚胎发生相关的信号通路和基因表达调控（国人佳作）

编译:夕夕,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读作者通过对玉米愈伤组织和体细胞胚胎进行转录组分析,揭示了玉米体细胞的基因重编程,信号通路和转录调控的信息. 体细胞胚胎广泛作物的繁殖和 ...
科研 |FUNCT INTEGR GENOMIC：转录组分析研究不同水稻品种对细菌条斑病的侵染（国人佳作）

编译:夕夕,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读细菌性条斑病(BLS)是目前水稻的第四大疾病.Dular和H359是两种对BLS有明显的水稻品种.Dular品种抗性较高而H359品种 ...
科研 |PLANTA：转录组分析研究草莓果实对外源精氨酸应答（国人佳作）

编译:夕夕,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读精氨酸(Arg)在植物发育和生长过程中起到很大的作用,但是关于他在草莓果实发育和生长起到的调控作用还不是十分清楚.本研究发现草莓果实着 ...

转录组分析

相关推荐