科研 | INT J BIOL MACROMOL:全基因组表达分析表明棉花谷氧还蛋白基因对不同胁迫的响应(国人作品)

编译:寒江雪,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

谷氧还蛋白(GRX)是广泛存在的氧化还原酶,参与多种细胞过程,在氧化应激反应机制中起关键作用。本研究旨在探讨GRX的结构-功能关系,为功能验证和生化特性提供一个框架。本研究鉴定了陆地棉中的127个GRX基因,根据系统发育分析,共有758个单子叶植物和9个双子叶植物的基因被分为4类。这种分类同样也得到了棉花、水稻和拟南芥保守蛋白基序和标志序列的支持。棉花GRX基因家族经过了较强的纯化选择。4个棉种间具有较强的共线性。在表达分析发现大多数GRX受到各种植物激素和非生物胁迫的影响,表明GRX蛋白在氧化应激反应中起重要作用。顺式调控元件、基因富集和共表达网络分析也支持它们对各种非生物胁迫的预测作用。全基因组和片段复制是进化过程中基因数量扩张的两大主要因素。GRX基因在特定组织中的差异表达或对环境刺激的反应的鉴定为深入鉴定所重要候选基因提供了新的方法。本研究将进一步拓宽对棉花GRX基因家族进化和功能的认识。

论文ID

原名:Genome-wide expression analysis suggests glutaredoxin genes response to various stresses in cotton

译名:全基因组表达分析表明棉花谷氧还蛋白基因对不同胁迫的响应

期刊:International Journal of Biological Macromolecules

IF:4.784

发表时间:2020.3

通讯作者:叶武威

通讯作者单位:中国农业科学院棉花研究所

DOI号:10.1016/j.ijbiomac.2020.03.021

实验设计

本研究通过11种植物相关的数据库中对GRX基因进行鉴定,通过系统发育分析、染色体定位、不同种间共线性分析、选择压力分析、蛋白质保守基序与基因结构分析、启动子区及差异表达基因分析和亚细胞定位预测对GRX基因家族进行生物信息学分析。并通过RNA-seq数据对GRX基因进行差异表达分析,GO功能注释,互作网络分析。

研究内容

1 GRX蛋白的鉴定

研究人员利用隐马尔可夫模型(HMM)在11种植物相关的数据库中对GRX基因进行鉴定。分别选择单子叶植物和双子叶植物进行研究。不同物种中鉴定到的基因数目如图1A所示。

两个四倍体棉种陆地棉(Gh)和海岛棉(Gb)中鉴定到的GRX基因数量是其祖先种Ga(亚洲棉)和Gr(雷蒙德氏棉)的两倍(图1B),也远大于其他物种的数量,这表明棉花中的GRX基因家族在进化过程中表现出了大规模的扩张。随后对GhGRX的基因长度(bp),蛋白质长度(aa),CDS长度(bp),对应的染色体及位点ID,链极性、起始位置和终止位置、预测等电点(Pl)、预测质量、蛋白质分子量(Mw)和亚细胞定位进行了分析。

图1 A GRX基因在11种植物中的分布。 B 谷氧还蛋白基因家族127个GhGRX基因在亚科的分布。

2单子叶植物和双子叶植物GRX的系统发育分析

为了了解GRX基因在棉花和其他植物中的进化历史,对758个GRX蛋白序列,其中包括棉花384个、拟南芥48个、水稻48个、毛白杨61个、欧洲葡萄33个、可可豆33个、玉米58个和大豆93个进行了系统发育分析(图2A)。GRX蛋白可分为CC型、GRL型、CGFS型和CPYC型四大类,其自举概率(Bp)在59~100%之间。陆地棉中4种类型GRX基因都有,其中CC型所占比例最高(56个),GRL型包含50个GhGRXCPYC型有12个,CGFS型仅有9个。CC型亚家族是几乎所有植物中GRX数量最多的一组GRX基因。

如系统发育树(图2A)所示,四个棉花不同亚种的直系同源基因均聚到其相关亚科分支,拟南芥,毛果杨,葡萄,可可,玉米和大豆中GRX是随机分布的,但都紧邻棉花GRX,说明大多数棉花GRX与拟南芥和其他双子叶植物的GRX比与单子叶植物的GRX亲缘关系更近。陆地棉的GRX基因增加了一倍以上说明经历了显著的基因家族扩张。除了雷蒙德氏棉、亚洲棉和可可以外的物种都有来自同一节的基因对,表明研究的所有物种中的GRX基因都经历了基因复制事件,导致了GRX基因家族的扩张。

此外,还构建了棉花GRX蛋白的系统发育树来研究二倍体棉花的共同祖先与异源四倍体棉花之间的关系(图2B)。系统发育树将所有棉花GRX蛋白分成四个分支,每个分支都有二倍体和异源四倍体棉花物种的蛋白质。说明陆地棉和海岛棉是两个二倍体棉种杂交的结果。

图2用邻接法(Neighbor-Join,NJ)构建了两个有根系统发育树。A 2种单子叶植物和9种双子叶植物中已鉴定的758个GRX基因的系统发育关系。B 4个棉种已鉴定的384个GRX基因的系统发育关系。

3保守蛋白质基序、基因结构和序列标志分析

基因的外显子-内含子分布模式与其生物学功能有关。结果表明,最长的GhGRX基因(GhGRX63)的基因组序列长度约为7010bp,而最短的仅有309bp。外显子/内含子分析和系统发育树分析结果说明,在不同分支中GhGRX的分布是随机的,在同一组系统发育树中,相似的基因聚在一起(图3A)。对GhGRX基因家族的外显子/内含子结构进行序列比较,并分析相对长度(图3B)。GhGRX基因外显子有1-12个不等,相似的基因在其组织结构上相近,但在内含子和外显子长度上有所不同。

127个GhGRX基因根据其内含子的数量可以分为三类。67.7%的基因家族成员没有内含子,说明GhGRX基因发生选择性剪接几率较小。GhGRX基因在进化过程中,基因结构与系统发育之间有较强的相关性,且除GhGRX96外,CPYC型亚家族的所有GhGRX都缺少内含子(图3B)。

研究人员构建了127个GhGRX基因的NJ树(图3A),以及基因结构和蛋白质基序分布(图3C)。所有GhGRX基因都具有保守的蛋白质基序,一部分蛋白质基序分布在多个GRX的多个类型中,其他一些只在特定类型中分布。保守基序与GRX在不同类别中的分组一致,可能是导致不同类型GRX蛋白之间功能特异性的原因。一些基序及其排列在同一类型中的不同GhGRX成员之间是相似的,说明蛋白质结构在特定的亚家族中是保守的(图3C)。

图3 GhGRX基因的系统发育关系、基因结构和基序组成。A采用邻接法(Neighbor-Join,NJ)构建127个全长GhGRX蛋白系统发育树。B GhGRX基因的外显子/内含子结构。 C GhGRX蛋白的保守基序。

4标志序列与系统发育分析

为了验证GhGRX基因在进化过程中是否保守,研究人员分析了陆地棉、海岛棉、野生稻的高度保守氨基酸残基的标志序列(图4)。发现GRX的结构域序列在典型的单子叶和双子叶植物中高度保守。拟南芥、水稻、海岛棉和陆地棉中的GRX蛋白序列标识将有助于发现、分析和评价其他植物中GRX蛋白序列的保守模式(图4)。

图4陆地棉(Gh)、海岛棉(Gb)、栽培稻(Os)和拟南芥(At)保守氨基酸残基的序列标识。

5染色体定位与基因复制

研究人员构建了陆地棉、雷蒙德氏棉、亚洲棉和海岛棉的384个GRX的染色体图谱。其中379个分布在各自特定染色体上,其余的5个GRX位于没有定位的scaffold上。

在已鉴定的127个陆地棉GRX中,其中有62个分布在At亚基因组(GhAt)的12条染色体上,64个GRX位于Dt亚基因组(GhDt)的13条染色体上,只有1个基因位于scaffold上。GhGRXGhAtGhDt亚组中均呈不均匀的随机分布。海岛棉123个GRX基因中的120个定位在26条染色体上,其余3个基因定位在scaffold上,At亚基因组(GbAt)包含61个基因,Dt亚基因组(GbDt)包含62个GRX(图5)。GbAt01GbDt01上基因数目最少,只有一个基因(图6C和D)。并且还对GbAtGbDt亚基因组与它们的二倍体祖先(A&D基因组)进行比较分析,发现6对染色体在GbAtA亚基因组中表现出相同的基因分布,但只有一对染色体GbDt05-D05基因数相同,其他染色体都呈不均匀和随机的分布(图5)。

在67个已鉴定的亚洲棉GRX基因中,有66个被定位到13条染色体上,只有一个GRX在scaffold上(图6E)。雷蒙德氏棉的67个GRX全部不均匀的分布在13条染色体上。D-11基因数最多(11),而D-01D-02基因数最少,只有两个基因(图6F)。GhAt / AGhDt / D比较发现6对染色体有相似的基因数目。而GbAt/A和GbDt/D组的7条染色体含有相同的基因数(图5),表明了基因在进化过程中丢失的程度,并见证了祖先在进化四倍体棉种过程中的参与。

图5四个棉花品种基因在染色体上的分布。
图6四种棉属的染色体定位。(A)陆地棉At亚基因组“GhAt”,(B)陆地棉DT亚基因组“GhDt”,(C)海岛棉At亚基因组“GbAt”,(D)海岛棉Dt亚基因组“GbDt”,(E)亚洲棉A基因组“Ga”,(F)海岛棉D亚基因组“Gr”。

6基因复制与共线性分析

基因家族的进化经历了全基因组复制、片段复制和串联复制三个过程。对陆地棉、海岛棉、亚洲棉和雷蒙德氏棉的GRX进行联合分析,分析它们之间的基因复制和共线性关系。海岛棉(Gb)和陆地棉(Gh)基因在雷蒙德氏(Gr)和亚洲棉(Ga)之间存在复制基因,表明多倍体化过程中两个四倍体基因组均来自二倍体基因组(A和D)。根据二倍体和四倍体棉种GRX基因家族成员间的染色体距离、覆盖率和相似性来鉴定片段重复序列和串联重复序列,以此来评价GRX基因家族之间的进化关系。

研究人员鉴定了两个四倍体棉种(陆地棉、海岛棉)的GhAt/GhDtGbAt/GbDt亚基因组的直系同/旁系同源基因对。共线性分析表明两个四倍体棉花品种的At和Dt亚基因组之间有几个基因位点高度保守(图7)。还发现GhAt/GhDtGbAt/GbDt在A和D基因组中存在它们的同源GRX。共鉴定出544对直系/旁系同源基因对,其中有107对在GhAt/GhDtGbAt/GbDt亚基因组片段复制中形成旁系同源基因对。只有3对重复基因发生了串联复制,其余434对重复基因都经历了全基因组复制(WGD)。根据这些结果推测,在多倍化之前,旁系同源基因对通常是从片段和全基因组复制中产生的,特别是片段复制是进化过程中最主要的影响因素(图7)。

图7四个棉种重复基因对的共线关系。

7非同义(Ka)同义(Ks)替换率的计算

为了研究达尔文正向选择是否与复制后的GRX基因替换有关,并确定这些重复基因对的选择压力的性质和程度,我们计算了来自4个棉种的8个组合的559个重复基因对的非同义替换率(Ka)和同义替换率(Ks)值。4个棉种的8个组合在进化过程中均表现出不同的选择压力水平。本研究中共从四个棉种中发现了559对重复的基因,其中Ka/Ks值小于1的重复基因对550对(98.4%), Ka/Ks值小于0.5的基因对有495对,在0.5~0.99之间的基因对有55对,表现为纯化选择。仅有9对(1.6%)重复基因对Ka/Ks比值大于1,这些基因对在复制后经历了较快的进化,并经历了正选择压力。由于大多数Ka/Ks值都小于1,因此研究人员棉花GRX基因家族经历了较强的纯化选择压力,但在分段复制和全基因组复制(WGD)后功能分化有限(图8A和B)。

图8非同义(Ka)与同义(Ks)比值。A Ka和Ks替换率分析。B四种棉属不同组合中重复基因对数目的预测。

8保守启动子及其在基因表达中的作用

考虑到顺式调控元件在非生物逆境中的重要性,研究人员利用PlantCARE数据库对GhGRX基因启动子区域的逆境相关和激素反应顺式作用元件进行了分析。位于转录起始位点(TTS)上游2000bp共鉴定到127个GhGRX基因的启动子区域,提取参与激素响应、胁迫耐受和植物生长发育相关响应的顺式调控元件。GRX基因家族成员的功能可能因其启动子区域的顺式元件不同而有所不同。将研究中发现的顺式作用元件分为三类。(1)植物生长发育;(2)植物激素响应;(3)生物/非生物胁迫响应(图9A,B和C)。

由于基因表达与顺式元件调控的生物学功能有关,通过转录组分析不同GhGRX基因在盐胁迫、干旱胁迫、热胁迫和冷胁迫等多种非生物胁迫条件下不同时间点(1Hr、3Hr、6Hr和12Hr)下的表达模式。大部分GRX在各种非生物胁迫下的表达水平没有明显变化,但GhGRX113、GhGRX52、GhGRX9、GhGR77、GhGRX32、GhGRX96、GhGRX63、GhGRX46、GhGRX110、GhGRX45GhGRX109的表达受到多种胁迫的诱导,表明它们参与了胁迫的响应。并且在同一亚家族中,不同胁迫下基因的表达也不一样。例如CC型中的一些基因对不同的胁迫表现出不同的表达水平,并且在所有的非生物胁迫下都能产生活性氧,而同一亚家族的其他基因没有明显的响应(图10A和B)。说明同一亚族中的基因虽然具有相似的基序,但其功能可能是不同的。GRX亚家族CPYC型和CGFS型除GhGRX87外的所有GRX基因的表达量均显著高于其它亚家族,表明这两个亚家族在植物适应恶劣环境条件中起着更为重要的作用。汇总了不同胁迫条件下差异表达基因的数目,发现一半的基因参与了冷胁迫的响应,其他胁迫下的差异基因数目如图10B所示。

对RNA-seq数据和顺式调控元件的统计分析表明,有一些顺式元件作为共同特征存在于大多数高表达基因的启动子中。包括上述11个高表达基因所含的MYB(生长素调节基因)和ABRE(与ABA相关的基因)。由于GhGRX基因含有一些特殊功能的元件及其启动子区域,因此这些基因除了参与植物激素反应外,还参与了盐、干旱、光、冷、热等非生物胁迫反应。这些结果表明,GhGRX具有改善非生物胁迫反应的能力,也可能对非生物胁迫(冷处理、热处理、PEG处理和盐处理)做出响应。

图9顺式调控元件的分布。A生长发育相关的顺式元件B非生物胁迫相关的顺式元件和C植物激素响应的顺式元件
图10 GhGRX家族启动子及差异表达基因分析。A GhGRX基因系统发育树。B GhGRX基因在冷、热、盐和PEG胁迫下的差异表达基因。C GhGRX基因启动子中的顺式元件。

9富集分析

GO分析表明,有127个GhGRX基因参与了生物学过程和分子功能。其中生物学过程包括细胞氧化还原稳态,细胞内信号转导等。分子功能方面包括电子转移活性,蛋白质二硫化物氧化还原酶活性和蛋白质结合等(图11)。

图11对127个陆地棉GhGRX基因GO注释分析。

10 基因互作用网络

为了进一步了解GhGRX基因在非生物胁迫中的作用,基于其相关基因表达的Pearson相关系数(PCC)分析其相关网络(图12)。在低温胁迫下,129个基因对呈负相关,188个基因对与8个hub基因对呈正相关(图12A)。在盐胁迫下,分别有257、457和11对基因呈负相关、正相关和高度正相关(Hub)(图12B)。热应激只对31个基因对产生负向影响,对326个基因对产生正向影响,对9个hub基因对产生正向影响(图12C)。干旱胁迫与164对基因呈负相关,与241对正相关,15个hub基因正相关(图12D)。共表达网络研究表明,GhGRX基因在几种非生物胁迫下受到显著影响,尤其是盐胁迫 GRX的响应最大。

图12利用RNA-Seq数据,以这些基因对的Pearson相关系数(PCCs)为基础,建立了127个GhGRX基因在胁迫下的相关网络。

11亚细胞定位预测

研究发现所有的GhGRXs蛋白都存在于包括线粒体、叶绿体、质膜、细胞核、细胞质和分泌途径在内的所有细胞成分中。本研究预测结果表明,所有的GhGRX都不一定在细胞中占据特定的位置,而是存在于各种细胞器中。在127个GhGRX中,预测在细胞核中的基因数目最多,其次分别在质膜、叶绿体、细胞质、细胞外和线粒体中预测有14、11、7、6和4个基因。表明GhGRX也调节细胞器中的生物过程。虽然这些结果为GRX蛋白的亚细胞定位提供了线索,但在棉花中还需要进一步实验证据来验证这一结果(图13)。

图13 GhGRX基因的亚细胞定位预测。

结论

本研究首次对4种棉花基因组中GRX基因家族进行了综合分析。本研究中鉴定到陆地棉中的127个GRX基因,通过系统发育分析和基序分析将其分为4类。染色体定位和基因复制分析表明,该基因家族在棉花中通过片段、串联和全基因组复制事件发生了扩张。表达分析揭示了GhGRX基因在时间和空间上的差异表达模式,说明GhGRX基因在植物整个发育周期中对植物生长发育的调控作用。此外,研究人员发现GhGRX基因的表达受多种环境刺激的影响,包括激素、非生物胁迫和生物胁迫,表明它们在激素和应激反应中的作用。本研究为进一步深入分析棉花GRX基因的功能提供了重要的信息。本研究有助于深入了解GRX在棉花中的生物学和分子功能以及在各种非生物胁迫下的抗氧化作用,为进一步研究这个重要基因家族的功能提供了框架。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐