科研 | 中国农业科学院:转录组学和蛋白质组学关联分析研究三叶木通果实不同阶段成熟过程中的开裂机制(国人佳作)
编译:微科盟 Young,编辑:微科盟景行、江舜尧。
原创微文,欢迎转发转载。
三叶木通由于其高种子数量、种子含油量和田间产量,可能作为一种新的潜在的生物燃料来源。然而,在果实成熟过程中,果皮会发生纵向开裂,增加病虫害的发生,并导致果实腐烂变质,造成重大的产量损失。很少有研究评价三叶木通裂果的机理。本研究通过观察果皮的细胞壁结构发现,与未开裂的果皮相比,开裂果实的果皮细胞壁变薄、变松,果皮破裂明显。通过对果实成熟不同阶段的转录组和蛋白质组谱的综合分析,揭示了果实裂解后各种基因和蛋白表达的变化。研究分析20个差异表达基因的mRNA水平,并对20个参与细胞壁代谢的差异表达蛋白进行平行反应监测分析。其中,裂解果实的果胶裂解酶和果胶酯酶(参与戊糖和葡萄糖醛酸酯相互转化)以及β-半乳糖苷酶2(参与半乳糖代谢)显著高于未裂解果实,这表明它们可能在三叶草果实裂解过程中起关键作用。研究结果为进一步研究影响三叶木通裂果性状的潜在基因提供了新的思路,为进一步培育抗裂果品种、提高生物精炼厂种子产量奠定了基础。
论文ID
原名:Integrative transcriptome and proteome analyses provide new insights into diferent stages of Akebia trifoliata fruit cracking during ripening
译名:转录组学和蛋白质组学关联分析研究三叶木通果实不同阶段成熟过程中的开裂机制
期刊:Biotechnology for Biofuels
IF:4.815
发表时间:2020年8月
通讯作者:陈建华
通讯作者单位:中国农业科学院
DOI号:10.1186/s13068-020-01789-7
实验设计
结果
1 果皮结构的变化
首先,研究者动态评估在不同的成熟阶段果实结构 (图1)。在未开裂阶段(PS)、果皮细胞和表皮密集排列,更小的细胞间空间和连续分布(图1 a、d、g)。然而,在初始开裂阶段,细胞壁变薄,细胞体积增加,细胞层数减少,和细胞松散排列完整性较差;细胞间距增大,外果皮和中果皮细胞在开裂初期开始降解(PM;图1b, e, h)。不规则排列的层数不断减少,空间不断增大,观察到在整个开裂阶段细胞降解的证据(PL;图1c, f, i)。
图1. Nong No.8′果皮在不同发育阶段的形态和结构变化。a-c 研究了三叶木通果皮在不开裂阶段(PS) (a)、初始开裂阶段(PM) (b)和总开裂阶段(PL) (c)的形态变化。用半薄切片法对农8号不同发育阶段的d-f果皮结构进行了染色。(d)、PM (e)和PL (f).利用PS (g)、PM (h)和PL (i)对 Nong No.8′不同发育阶段果皮的g-i结构进行扫描电镜分析。
2 转录组分析概述
研究共构建了9个cDNA文库,从PS、PM和PL文库中分别获得了47.05、46.92和5400万的原始序列reads。剔除低质量reads和adaptor序列后,分别有46.45、46.35和5346万reads,Q30碱基91.58-93.75%,GC含量45.94-48.48%。结果表明,三叶木通转录组包含241,376个转录本,范围从201 bp到2000 bp,以及186,054个unigenes (表1)。
表1.三叶木通果实转录组和蛋白质组数据综述。
所有的unigenes使用基本局部比对搜索工具(BLAST)对以下5个数据库进行检索:NR、SwissProt、Pfam、GO和KEGG,其中NR数据库注释最多。100,329条unigenes与至少一个公共数据库的序列对应,7283条unigenes被注释到所有数据库。此外,有17,601,19,281和13,525个共有的 unigenes和45,866和48,104以及43,303分别在PS, PM和PL未查找到。其中大部分在注释结果中都是未鉴定的、未知的和假设的蛋白质。
在这些unigenes中,9301人被确认为不同表达基因丰度, 分别包括2703,4694和1904中的共表达在与PS和PL和PM分组(表2),它在火山图也表达出来了。
表2.从RNA和TMT序列数据中检测到的转录本和蛋白质。
3 已鉴定的DEGs的功能分类
生物信息学分析表明,氧化石墨烯生物过程(BP)中的大多数DEGs参与细胞的酰胺代谢过程和酰胺代谢过程。PM_PS和PL_PM组中与结构分子活性和氧化还原酶活性相关的基因在分子功能(MF)分类中所占比例最高。PM_PS组和PL_PM组中DEGs在细胞成分(CCs)中所占比例分别为细胞质部分和细胞内核糖核蛋白复合物(图2a, b)。
图2. GO和KEGG途径对DEGs和DAPs的富集分析。PM_PS (a)和PL_PM (b)中DEGs的GO分类。横轴为生物过程、分子功能、细胞成分分类中富集程度最高的30个GO项。纵轴表示每一时期丰富的基因数量。PM_PS (c)和PL_PM (d)中DAPs的GO分类。横轴为生物过程、分子功能、细胞成分分类中富集程度最高的20个GO项。纵轴表示每一项中富集的蛋白质的数量。每个直方图的高度和颜色表示基因/蛋白质的数量和富集项的p值。每个直方图的标签表示富因子,它代表DEG/DAPs与GO功能类别中确定的总基因/蛋白的比例。e, f KEGG通路分别富集PM_PS和PL_PM中的DEGs。g-h KEGG通路分别富集PM_PS和PL_PM中的DAPs。横轴为KEGG通路项的富集因子(e, f),以及每个项中富集的蛋白数(g, h)。纵轴为顶部富集的KEGG通路项。圆的大小和颜色分别表示富集项的基因数量和p值。每个直方图的长度和颜色表示蛋白质的数量和富集项的p值。每个直方图的标签表示丰富因子,它表示DEG/DAPs与KEGG通路功能类别中鉴定的总基因/蛋白的比例。
KEGG通路分析表明,PM_PS比较中许多DEGs富集在代谢通路和核糖体中,PL_ PM比较中次生代谢产物的生物合成和代谢通路中富集(图2e, f)。聚类分析表明,与细胞壁相关的DEGs(285)在PM_PS和PL_PM组中紧密聚在一起,包括戊糖和葡萄糖酸酯的相互转化、苯丙素途径、半乳糖代谢、淀粉和蔗糖代谢、氨基糖和核苷酸糖代谢以及转录因子。PM_PS组大多数DEGs表达下调,而PL_ PM组的DEGs表达上调(图3)。
4 定量蛋白质组分析
通过蛋白质组学分析,共测定了812,625个光谱、68,151个鉴定光谱、12,456个肽、10,572个独特肽和2839个蛋白(表1)。在蛋白质质量分布上,分子量大于9 kDa的蛋白质分布范围广,覆盖度好,最大分布面积为10-40 kDa。肽定量蛋白质分析表明,随着匹配肽的增加,蛋白质的数量减少。
在这2839个蛋白质,223个被确认为差异富集的蛋白质(DAP),其中PM_PS和PL_PM组分别包括173(75上调和98下调)、33(20上调和13下调)和17种共表达蛋白(表2)。
5 已鉴定的DAP的功能分类
GO分析表明,BP类DAPs大多参与PM_ PS组的细胞化学刺激反应和细胞氧化解毒过程,以及PL_PM组的代谢过程和大分子代谢过程。MF类中DAPs比例最高的是PM_PS组的氧化还原酶活性和抗氧化活性,PL_PM组的核糖体结构成分和结构分子活性。PM_PS组的细胞外区域和胞质部分PL _PM组显示最高的部分dap CC类别(图2 c, d)。KEGG路径分析表明,许多蛋白质丰富的双组分体系和核糖体途径(图2 g,h)。
聚类分析显示,在PM_PS和PL_PM组中40个与细胞壁相关的DAPs,包括戊糖与葡萄糖醛酸相互转化、苯丙素途径、半乳糖代谢、淀粉与蔗糖代谢、氨基糖与核苷酸糖代谢等细胞壁代谢相关蛋白紧密聚在一起。值得注意的是,大部分DAPs在PM_PS和PL_PM组均上调。另外,参与苯丙素途径和半乳糖代谢的DAPs在PM_PS组下调,而在PL_PM组上调(图3g-l)。此外,蛋白-蛋白相互作用(protein-protein interaction, PPI)网络分析显示,PM_PS和PL_PM组共85个DAPs参与了相互作用网络,其中上调的29个,下调的56个 (图4)。
图4. DAPs的String 9.0对功能网络的分析。a PM_PS中DAPs String 9.0对功能网络的分析。b 用PL_PM中的DAPs String 9.0分析功能网络。红色表示显著上调的蛋白质,蓝色表示显著下调的蛋白质。
6 蛋白质丰度与基因表达的比较分析
裂果的DEGs(11,205)多于DAPs(240),共享DEGs(1904)多于共享DAPs(17)。PM_PS组大部分表达下调,PL_PM组表达上调(表2)。此外,整合蛋白质组和转录组数据显示,14和4个DAPs和他们的基因相对应。此外,PM_PS和PL_PM组中分别有12和4 DAPs显示相同的趋势,在PM_PS组中有两个显示出与DEG相反的趋势(图5 a、b)。此外,经Pearson相关检验,蛋白质组和转录组之间响度相关度不高(r = 0.03和0.11),DAPs的fold-changes与相应的DEGs呈显著的正相关 (r=0.9161和 0.8),程度较高。
7 与候选通路相关的DAPs和DEGs的鉴定
GO富集蛋白组和转录组的相关性表明,GO富集最大的类群是在PM_PS和PL_PM组中,BP、MF和CC类中的这些DEGs和DAPs分别与代谢和细胞过程、催化活性和结合以及细胞和细胞部位有关。KEGG富集结果显示,大部分富集于苯丙素生物合成、戊糖和葡萄糖酸酯的相互转化,PM_PS组的氨基糖、核苷酸糖代谢和半乳糖代谢。大多数在PL_PM组中,无论是在蛋白质组还是转录组中,都显著富集于戊糖和葡糖醛酸酯的相互转化以及半乳糖代谢通路。比较分析表明,PM_PS和PL_PM组均存在戊糖与葡萄糖醛酸酯相互转化和半乳糖代谢两条通路。相比之下,苯丙烷类生物合成途径仅在PM_PS组交集。
8 通过反转录实时定量PCR (qPCR)和并行反应监测(PRM)验证数据的可靠性
选取20个DEGs进行qPCR实验,结果如图6所示。PM_PS组苯丙素途径相关基因4-香豆酸辅酶a-连接酶(4CL)、过氧化物酶(PRX)和PRX2表达下调,而肉桂醇脱氢酶(CAD)和香茅酸邻羟基肉桂酰转移酶(HCT)表达上调。半乳糖代谢相关基因β-GAL1和β-GAL2;氨基糖和核苷酸糖代谢相关基因β-d-木糖苷酶(BXL),并且淀粉和蔗糖代谢相关基因纤维素酶(CEL)、纤维素合成酶样蛋白(CSLG)和葡聚糖恩度-1,3-β-葡萄糖苷酶(ENDOB)下调。细胞壁代谢基因NAC、NAC-like和EXP1下调,而BHLH转录因子和引导蛋白(DIR2)上调。戊糖和葡糖醛酸互转相关基因PL、PG和PE表达上调。PL_PM组除4CL、CAD、β-GAL和EXP1外,其余基因均显著上调。DIR2、NAC-like、EXP1、CAD、β-GAL1、β-GAL2、4CL、ENDOB、PE、BHLH、PG3、CEL、PRX2等13个候选基因的表达与相应RNA-seq数据的相关性较强,其中7个基因的表达与相应RNA-seq数据的相关性较差(图6;表3)。
图6.所选基因的qPCR验证和表达分析。通过RNA-seq(左y轴)和qPCR(右y轴)检测基因的表达水平。RNA-seq检测基因表达的直方图。折线图经qPCR验证为相对表达。
表3.所选基因qPCR与FPKM值的相关性分析。
选择20个DAPs进行PRM分析,其中18个具有显著差异。在18个DAPs中,有14个(77.8%)在PRM和TMT定量分析中表现出相同的丰度趋势,包括PE、PL、PG2、糠甾醇糖苷26-o-β-葡萄糖苷酶(F26G)、β-GAL2、生长素外排载体、α/β水解酶(α-HY)、PRX2、PG4、PRX5、PRX3、内切葡聚糖酶19、内切葡聚糖酶8和DIR1。此外,4个基因(PRX、β -果糖呋喃糖苷酶、BXL和BGLU33)的丰度不一致用TMT定量蛋白质水平(表4)。总的来说,PRM和TMT检测的表达变化趋势是一致的。值得注意的是,在PM_PS和PL_PM组中,几个涉及细胞壁代谢通路的基因在转录组和蛋白质组中表现出一致的上调/下调(图7)。
图7.三叶木通果实成熟和开裂的一些生物学途径综述。红色表示显著上调的蛋白质,蓝色表示显著下调的蛋白质。白色表示无明显变化的蛋白质。
讨论
1 果皮细胞壁的结构变化可能会影响三叶木通果实的开裂
当增大的假皮对果皮施加的应力大于果皮的强度时,就会发生果皮开裂,果皮的机械强度主要取决于其细胞壁。研究表明,红枣果实开裂可能与果实成熟后期细胞壁结构变化和重排有关。抗裂性番茄基因型的细胞皮下层排列相对规则,细胞层排列较为紧密。在本研究中,三叶木通果实的果皮细胞壁完整性较差,结构疏松,细胞层变形减少,间隙较大,在成熟过程中开始降解,这与之前葡萄和橙子的研究结果一致。这表明,细胞壁结构的变化可能在三叶木通果实开裂的发生中起关键作用。
2 不同类型三叶木通果皮转录组和蛋白质组的一般特征
果实开裂是影响种子产量的关键因素。阐明果实裂解的分子机制有助于利用三叶木通种子开发生物燃料。然而,三叶木通裂果的潜在机制在很大程度上仍不清楚。在本研究中,研究者利用RNA-seq和TMT数据研究了不同时期的转录组和蛋白质组的差异。由于转录组数据库用于蛋白质鉴定,转录组数据的测序和组装质量对后续分析至关重要。总共有186054个unigenes在三叶木通(A. trifoliata)果皮转录组中聚集,这一数字远高于该物种和其他毛茛属植物如三叶草的11749个unigenes、云南八角莲的53,929个unigenes和八角莲的44,855个unigenes。所获得的Q30碱基百分比和GC含量与其他研究中报道的三叶木通转录组的分别为89.06-93.33%和43.20-43.93%,分别为96.31%和45.10%。在本次研究中,总共有分别有100,329(53.9%)和56,346(30.3%)的unigenes与NR和SwissProt数据库匹配。这些结果与报道的云南八角莲相似,高于其他类似的三叶青藤转录组研究,其中NR和SwissProt数据库分别为34245和23352个,SwissProt数据库为19096个。本研究结果为三叶木通提供了广泛的序列和unique基因资源。
此外,根据三叶木通果皮转录组数据鉴定出812,625短肽、10,572条特异肽和2839条蛋白。RNA-seq和蛋白质测序方法鉴定和注释了许多基因和蛋白质,为更精确和详细地描述分子过程和阐明复杂的生理过程及其遗传调控提供了基础。本研究提供的数据足够准确,为进一步开展三叶木通和其他木通科植物果实开裂的遗传研究提供了有用的工具。此外,注释结果中有许多“未鉴定的”、“预测的”或“假定的”转录本和蛋白质,表明由于缺乏基因组信息,分析的性质有限。因此,这些未知或未鉴定的基因和蛋白在三叶木通果实裂解过程中的作用有待进一步研究。
3 三叶木通果裂解的转录和翻译后调控
果皮破裂后必然会发生一些被动过程,如氧化应激和微生物入侵。因此,单凭PS、PM和PL的基因和蛋白表达差异并不能准确反映裂果的原因。在本研究中,研究者通过蛋白质和基因表达水平的比较分析表明,在已裂果中鉴定出的DEGs和共享DEGs多于未裂果。这可能是由于基于质谱的蛋白质组学技术的局限性,如可获得的样本数量少,用于定量数据采集的质谱扫描率低,以及需要广泛的分离,限制了识别蛋白的能力。PPI分析表明,蛋白质之间的相互作用是罕见和弱的,这与许多细胞过程的相互作用通常是弱的结果有关,这些过程受到翻译后修饰的调控,这些修饰被蛋白质结合的特定结构域所识别。此外,相关分析显示蛋白质组和转录组之间呈负相关,表明转录水平和蛋白质丰度之间存在不一致。这些结果与之前的研究结果相似,表明转录后和翻译后调控、可逆的磷酸化、细胞中的剪接事件和翻译效率在调节果实成熟过程中起关键作用。因此,基因翻译和翻译后过程可能是调控果实成熟和裂果的重要手段。
4 果实裂解过程中潜在的调控因子和代谢途径
GO和KEGG功能富集提供了细胞内代谢途径以及基因遗传和生物学行为的预测信息。氧化还原酶活性和结构分子活性相关的GO主要富集在PM_PS组和PL_PM组中,这与之前的研究相似,目的基因可以根据功能分为不同的类别,如过氧化物酶和细胞壁多糖。细胞多糖是由细胞壁水解酶降解,而酚交联的细胞壁结构成分是催化细胞壁过氧化物酶。这些修饰降低了果皮的强度,导致果皮发育和果实开裂的变化。KEGG分析表明,与细胞壁相关的通路,包括戊糖和葡萄糖醛酸相互转化、半乳糖代谢通路和苯丙素合成通路,是DEGs和DAPs的共同通路,提示细胞代谢在三叶草果实成熟和裂解过程中可能起重要作用。这些结果表明,蛋白质组学数据与转录组学数据是互补的,蛋白质组学可以证实转录组学数据;此外,基因在转录组和蛋白质组水平上执行相同的功能。转录组和蛋白质组的功能分类有助于加深对果实成熟和裂化的分子生理学认识。
5 候选的DEGs和DAPs可能在果皮开裂中起关键作用
果实裂解是一个复杂的生理过程,它不是由单个基因直接控制的,而是由众多基因共同控制的。研究人员发现,一些细胞壁修饰基因,包括β-GAL、β-GLU、PE和PG在开裂的荔枝果实中与未开裂的荔枝果实中表达水平存在差异。下调PpBGAL可通过降低PG和果胶甲基酯酶活性来延缓桃果实软化。抑制PE和PG活性可以减少番茄果实开裂。另外,沉默SIPL基因可以提高果实质量表明该基因参与了果实软化过程中果皮细胞壁的重排。果实软化主要是由半纤维素和果胶降解蛋白引起的,如XYL、BGAL、PE和PG。作为主要的纤维素降解酶,草莓BGLU蛋白的下调可以延缓果实的成熟。在植物发育过程中,PRXs还参与细胞壁多糖的重排。
在本研究中,参与细胞壁代谢的13个DEGs和14个DAPs与RNA-seq数据和蛋白表达水平有很强的相关性,这与细胞多糖代谢可能在果实成熟和开裂中发挥关键作用的结果一致。值得注意的是,三个蛋白质的表达水平(β-GAL2,PE、和PL)与半乳糖代谢和戊糖和葡萄糖醛酸酯互变现象通路显示更高的蛋白和基因表达在破裂水果比不破裂水果高,这表明PE、PL,β-GAL2可能在三叶木通果实开裂扮演重要角色。
F26G、PG、PG3、XYL、PRX3和PRX5在开裂果中的蛋白和基因表达量均高于未开裂果。这些细胞壁代谢蛋白的表达显著增加表明,在果实成熟过程中,果胶、半纤维素和细胞壁纤维素构成了一个网络。
结论
研究结果揭示了三叶木通果皮发育不同阶段细胞壁结构的变化,表明未熟和熟果之间的结构变化是影响果实开裂倾向的重要因素。为了加强果皮结构,可以通过套袋和1-MCP处理来减少果实开裂。采用比较转录组分析和蛋白质组学分析方法鉴定参与果实裂解的潜在基因/蛋白。各种基因和蛋白质在裂解后均有差异表达。3个共表达基因(PE、PL和β-GAL2)参与果实发育、细胞壁降解和果实软化的多种信号通路。这些组学数据为研究三叶草果实裂解过程提供了新的视角。在未来的工作中,需要转基因植物过表达候选基因来验证这些基因的功能。将开发果实裂解的分子标记,利用这一特性在育种和提高生物炼制的种子产量。
1 科研│山东农业大学:综合转录组和蛋白质组分析揭示玉米种子萌发过程中氯化钠响应基因网络(国人佳作)
不来关注一波嘛
END