科研 | Plant Cell and Environment:转录组应用:在大豆种子贮藏组合物中挖掘中心基因(国人作品)
编译:菜鸟菠萝,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
大豆是重要的食用油和蛋白质来源作物。大豆油脂和蛋白质含量是数量遗传,并受环境因子的显著影响。本研究在已有大豆物理图谱的基础上进行荟萃分析,整合不同环境下多个试验的数量性状基因(QTL),确定了控制种子含油量、脂肪酸组成和蛋白质含量的Meta-QTL。其中11个QTL热点区域包括了种子含油量和蛋白质含量这两个性状。接下来,研究者选择了4个种子含油量和蛋白质含量不同的染色体片段置换系,对它们进行了3年的田间表型鉴定。利用链特异性RNA测序分析,分析了大豆种子在成熟早期、成熟中期和干种子阶段的时间内转录组表达模式。结果显示,筛选到差异表达基因7482个,45种表达模式。加权基因共表达网络分析揭示了46个基因表达模式模块。可视化了2个最显著的共表达网络,并鉴定了7个参与大豆油脂和种子贮藏蛋白积累过程的主要基因。研究结果为大豆种子发育提供了一个转录组数据集,同时通过共表达网络筛选候选基因为后续研究奠定了一定基础。
论文ID
原名:Meta-analysisand transcriptome profiling reveal hub genes for soybean seed storage composition during seed development
译名:荟萃分析和转录组分析揭示了大豆种子发育过程中种子贮藏成分的核心基因
期刊:Plant Cell and Environment
IF:5.62
发表时间:2018年9月
通讯作者:陈庆山&刘军
通讯作者单位:东北农业大学农业学院,中国农业科学院作物研究所
DOI号:10.1111/pce.13175
实验设计
基于前人绘制的82幅物理图谱进行荟萃分析。由Suinong14和ZYD00006杂交获得染色体置换系(CSSL)种群,从中选择HPHO、HPLO、LPHO、LPLO 4份材料于2014年、2015年、2016年在哈尔滨进行三次重复实验。并在成熟前期(EM1),种子成中熟期(MM)和干种子阶段(DS)测定种子脂肪酸含量、总氮含量,结果表明种子油含量和种子蛋白质呈负相关。并取样进行转录组测序筛选差异表达基因(DEG),制作共表达网络(WGCNA),分析相关基因(以上分析均在R语言中完成)。
结果
1 大豆种子成分的Meta-QTL
为了确定调节大豆种子油和蛋白质积累的相关遗传基因,在对已有的有关大豆油质QTL的基础上进行分析和整合并进行了荟萃分析。分析发现了63个M-QTL,它们主要分布在除10号染色体外的所有连锁组上。有51个M-QTL,分布在16号染色体以外的所有连锁组上。通过比较M-QTL的种子油和蛋白质性状,研究者发现有11个M-QTL包含了这两个性状的热点区域。Gm05上的一个热点区域:40.06–40.61 Mbp,对种子蛋白质含量的表型效应贡献为8.75%,对种子蛋白质含量的贡献为14.35%。通过对已有的QTL进行荟萃分析,发现26个有关脂肪酸M-QTL;并在2号,7号,9号,13号,14号,15号和19号染色体上鉴定了11个亚麻酸的M-QTL;硬脂酸的M-QTL分布在第6、13和18号染色体上;棕榈酸的M-QTL在9、15和18号染色体上;亚油酸的M-QTL分布在5号,10号,16号,18号染色体上。
![](http://n4.ikafan.com/assetsj/blank.gif)
图1 大豆种子成分(种子油、种子蛋白、种子脂肪酸)的M-QTL
2 对四种CSSL种子含油量和蛋白质含量的表型指标分析
通过SN14和ZYD00006杂交构建了CSSL库,纯合重组BC3F2,BC3F3,BC3F4,BC3F5和BC3F6系,并通过自交至少纯化至F6世代。从中选择了HPHO、HPLO、LPHO、LPLO 4份材料,于2014年、2015年、2016年在哈尔滨进行了三次重复实验,并在成熟早期、成熟中期和干种子阶段测定种子含油量及蛋白质含量,两者表现为负相关,相关系数为-0.58(2014),-0.77(2015)和-0.46(2016)。大豆种子在成熟后期达到最大,干燥阶段失水变小,种皮颜色逐渐加深呈黄色。同时测定不同油脂含量,结果表明在早期由亚油酸和亚麻酸占主导,中期亚麻酸含量下降。总的发育过程中油酸和亚油酸的百分比呈增加趋势。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
图2 A大豆种子发育过程。B EM1至DS种子中的总氮含量。C EM1至DS分析的种子中主要脂肪酸含量,a)棕榈酸含量b)硬脂酸含量c)油酸含量d)亚油酸含量e)亚油酸含量f)总脂肪酸含量。
3 转录组分析
通过转录组分析确定了7482个差异表达基因,并确定了45种表达模式。GO富集分析表明,主要在代谢过程、多糖代谢过程、光合作用。并在不同样品及不同阶段可检测到上调和下调的基因。如在HPLO中,EM阶段有1192个上调基因和1064个下调基因,MM阶段有2623个上调基因和536个下调基因,而DS阶段分别有70个上调基因和284个下调基因。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
图3 转录组分析。(A)7482个DEG的热图,分析了45种表达模式。(B)在各个阶段,HPHO,HPLO,HOLP和LPLO上调(红色)或下调(绿色)的数目。(C)(D)FDR <0.01水平的AgriGO富集。
4 鉴定不同阶段特异性基因和CSSL特异性基因。
在DS阶段进行了与EM和MM阶段相似的分析比较,筛选出14种与种子贮藏组成相关的DEG。这些DEG仅在三个过程中富集,包括脂质合成和代谢,脂质转移和与种子存储蛋白相关的过程,因为代谢过程变慢会在种子中存储了更多的相关成分。
5 加权基因共表达网络分析
一共有47265个基因用于WGCNA分析。分析了特征基因与种子组成性状的相关性,选择具有显着关联,并在P值<0.05的水平上选择了特定于性状的模块。其中八个模块与种子贮藏蛋白相关,七个模块与种子脂肪酸相关。通过kME> 0.95共发现4815个与脂肪酸相关的主要基因;946个与蛋白质相关的基因。通过M-QTL确定相应区域,发现总共有648个基因在种子含油量M-QTL区域内;有118个基因对应于种子蛋白的M-QTL区域内。建立了两个共表达网络,第一共表达网络包括两个主要基因,一个为Glyma.01G164100(注释为液泡蛋白分选(VPS35)),另一个为Glyma.18G041900被标注为Zn依赖的外肽酶超家族蛋白,但尚无明确的信息表明它相关作用,因此应作为进一步研究的对象。另一个网络包括五个主要基因,其中已明确与大豆脂质生物合成相关,以及大豆种子贮藏蛋白相关。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
图4 模块特征关联,以及网络共表达分析。
结论
本研究基于大豆物理图谱进行了荟萃分析,并在Gm02:42.89–44.70Mbp,Gm03:36.43–38.98Mbp,Gm05:40.06–40.61Mbp,Gm06:36.49–40.11Mbp,Gm07:4.97–5.36Mbp,Gm08:7.91–9.29Mbp,Gm12:36.62–36.45Mbp,Gm13 28.45–29.76 Mbp,Gm17:38.16–39.73 Mbp,Gm19:41.02–42.41 Mbp和Gm19 45.66 47.09 Mbp上确定了种子油含量和蛋白质含量性状的“热点”。这11个MQTL间隔覆盖了两个特征的热点区域。在这些M-QTL中,热区Gm05:40.06–40.61 Mbp对种子蛋白质含量的表型效应贡献为8.75%,对种子油含量的表型效应的贡献为14.35%,相比之下,原始QTL分别为6%和15%。
通过转录组分析,在发育过程中共筛选7482个差异表达基因,45种表达模式,筛选出946个与蛋白质相关的基因、4815个与脂肪酸相关的基因、有648个与种子含油量相关的基因以及118和种子蛋白质含量相关的基因。构建两个共表达网络,鉴定了7个主要基因,其中一个表达网络包含一个为Glyma.01G164100(注释为液泡蛋白分选(VPS35)),以及一个新基因Glyma.18G041900。另一个共表达网络中有5个主要基因,都是与贮藏种子化合物有关的同源基因。并在种子发育不同阶段比较了5个经典基因的表达模式,其中只有GmABI3a,GmABI3b,GmLEC1a和GmLEC1b在CSSL中显示出较高的表达。而GmWRI1a,GmLEC2,GmFUS3a和GmFUS3b并没有表现高表达水平。
讨论
目前,有关大豆种子含油量以及种子蛋白质的QTL已有许多相关报道,并筛选到相关基因。同时许多经典的遗传学和育种书籍或文章都指出大豆油和蛋白质含量之间存在负相关的关系。尽管很难找到可以同时增加大豆油和蛋白质含量的相关基因,但基于大量QTL定位结果,某些热点区域确实同时促进了大豆种子油和蛋白质含量的增加。在已发布的大豆油含量QTL中,有一些“热点地区”在不同研究中被确定到四次或更多次。染色体置换系已被广泛用于水稻,番茄,棉花,大麦,小麦和玉米中,用于基因座精细定位,因为它们提供了明确的遗传背景。本文选择4个染色体置换系,通过荟萃分析,在11个热点区域里涵盖了种子含油量油和蛋白质这两个性状。同时结合连特异性转录组分析筛选到7个主要相关基因。尽管已经鉴定出许多种子含油量相关基因,并且已经在拟南芥中研究了它们的相关调节网络,但是WRI1,LEC1,LEC2,ABI3和FUS3在大豆中的作用仍不清楚,因为基因组重复了75%,此外比较了这几个经典基因的表达模式,其中只有部分由高表达,其中可能涉及其它基因,如本文中确定的7个主要基因。同时通过共表达网络确定了7个主要基因,这些结果为研究大豆种子含油量和蛋白质含量提供了重要信息。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响