科研| The Plant Journal: 在重组自交系群体中对水稻种子三个发育时期的比较代谢组分析(国人佳作)
编译:秦时明月,编辑:谢衣、江舜尧。
原创微文,欢迎转发转载。
水稻是人类重要的食物和营养来源。尽管科学家们已经在植物代谢组学方面取得了进展,但对水稻籽粒不同发育时期代谢物的遗传和分子机制的了解仍然有限。本研究以珍汕97(ZS97)和明恢63(MH63)为材料,对灌浆期籽粒、成熟期籽粒和发芽期籽粒进行了广泛靶向代谢组分析。MH63和ZS97在代谢物含量和不同发育时期的代谢物迁移方面表现出一定的差异性。研究人员利用ZS97与MH63杂交获得了包含210个品系的重组自交系(RIL)群体及其超高密度遗传图谱,在三个时期的籽粒中鉴定出4681个可能的代谢相关数量性状位点(mQTLs)。对三个时期共检测到的代谢物的mQTLs分析表明,代谢物积累的遗传调控与发育时期密切相关。本研究共筛选出了35个候选基因,它们与30个已进行结构鉴定或注释的代谢物相关,其中LOC_Os07g04970和LOC_Os06g03990分别与阿魏酰5-羟色胺和L-天冬酰胺含量在品系间的差异有关。代谢物-农艺性状关联性分析及mQTLs与表型数量性状位点(pQTLs)的共定位揭示了代谢物与农艺性状之间的复杂性及其遗传基础。
论文ID
原名:Comparative analysis of metabolome of rice seeds at three developmental stages using a recombinant inbred line population
译名:在重组自交系群体中对水稻种子三个发育时期的比较代谢组分析
期刊:The Plant Journal
IF:5.726
发表时间:2019.07
通讯作者:罗杰&房传营
通讯作者单位:华中农业大学&海南大学
实验设计
本研究用于连锁定位的RIL群体由水稻品种ZS97和MH63杂交得到的210个品系组成。检测代谢物所用的发芽期籽粒为水稻种子培养72h后的籽粒、灌浆期籽粒为水稻灌浆10天后的籽粒、成熟期籽粒为水稻进入成熟期后收获的籽粒。本研究利用MRM方法来量化代谢物含量,并在成熟期籽粒、发芽期籽粒和灌浆期籽粒中分别检测到810、836和855个差异代谢物。本研究QTL定位中使用的Bin图由1619个无缺失数据的重组bins组成。整个基因组被分成1 cM的区段,成熟期籽粒、发芽期籽粒和灌浆期籽粒中随机选择的每cM mQTL的数量分别为7个、7个和8个。本研究利用从水稻品种中花11(ZH11)的cDNA样品中扩增出的全长cDNA及 Gateway重组反应构建LOC_Os06g03990的过表达载体,并通过农杆菌介导法将其转入ZH11,并利用qRT-PCR检测目的基因的表达。
实验结果
1 不同发育时期水稻籽粒代谢组分析
为了了解籼稻品种不同发育时期籽粒的代谢变化,该研究首先对籼稻材料的发芽期籽粒(96份材料)和成熟期籽粒(108份)进行了代谢组分析,并对发芽期籽粒中的167种代谢物和成熟期籽粒中的296种代谢物进行了结构鉴定或注释。为了直观显示这些代谢物在籼稻籽粒中的积累模式,研究人员进行了系统聚类分析。结果显示,发芽和成熟期籽粒的代谢物含量在籼稻材料中有显著差异。
为了进一步确定MH63和ZS97在不同发育时期籽粒代谢物含量和迁移的差异,对灌浆期、成熟期和发芽期籽粒进行了广泛靶向代谢组分析。虽然先前的研究在发芽期籽粒中检测到了317种代谢物,但该研究通过优化的方法在发芽期籽粒中检测到了836种代谢物,并结合灌浆期籽粒中的855种代谢物和成熟期籽粒中的810种代谢物获得了一个数据矩阵,其中共包括2501个代谢物,其中有372个代谢物是三个时期所共有的(图1a)。在这些代谢物中,有233种代谢物被结构鉴定或注释,并被归类为氨基酸、花青素、脂肪酸、类黄酮、多胺或维生素。主成分分析(PCA)表明,42.4%和28.9%的变异分别由成分1和2引起 (图1b)。此外,同一品种不同时期籽粒间的差异远大于同一时期不同品种间的差异,说明不同发育时期的水稻籽粒代谢差异明显大于两个不同基因型品种之间的差异。研究人员根据MH63和ZS97在三个时期的代谢组数据绘制的热图进一步支持了与发育时期相关的积累模式。如图1c所示,与其它时期的籽粒相比,每个时期的水稻籽粒都积累了高水平的不同代谢物。例如,发芽期籽粒中的黄酮和氨基酸含量显著高于成熟期或灌浆期籽粒。此外,同一类的代谢物也表现出不同的积累模式。与其它时期的籽粒相比,成熟期籽粒显示出更高的腺苷含量,尽管大多数核酸衍生物往往在灌浆期与发芽期籽粒中积累较高水平。虽然在MH63的三个时期检测到的代谢物积累模式与ZS97相似,但有几种代谢物显示出不同的变化(图1c)。例如,在MH63品种中,成熟期和发芽期籽粒中m0800含量与灌浆期籽粒相比都有不同程度的下降。虽然ZS97籽粒中m0800含量在各个时期均显著低于MH63,但同一代谢物在ZS97的三个时期的积累规律与MH63相反,表明其相应代谢物存在复杂的调控网络。
为了研究MH63和ZS97代谢变异的遗传决定因素,研究人员对210个个体组成的RIL群体进行了进一步的研究,并采集了水稻灌浆期、成熟期和发芽期三个不同发育时期的籽粒样品。不同RILs的代谢物含量差异很大,灌浆期、成熟期和发芽期籽粒的平均变异系数(CV)分别为60.91%、71.44%和60.71% (图2a)。近一半代谢物在三个时期都有相对较高的变异系数(CV>50%),特别是次生代谢物例如花青素、黄酮和萜类等。
为了可视化RILs上的代谢变化,研究人员对上述时期的代谢组数据进行了聚类分析(图2b),并观察到RILs在同一时期或不同时期的代谢组都发生了巨大的变化。有几种代谢产物在籽粒发育的某些时期优先积累。例如,L-精氨酸、L-天冬酰胺、L-组氨酸、L-丝氨酸和L-苏氨酸等氨基酸在发芽期籽粒中积累水平相对较高(图2c)。此外,研究人员还观察到在灌浆期、成熟期和发芽期籽粒中代谢物的动态变化,表明在这三个时期都有持续的代谢过程。例如,在三个时期的籽粒中都观察到了胞苷含量增加,而腺苷表现出相反的趋势(图2d)。
2 水稻籽粒代谢变化的mQTL定位
本研究利用群体测序方法构建的1619个bins的超高密度图谱在灌浆期、成熟期和发芽期籽粒中分别获得了1600、1506和1575个mQTLs,其中86.0%(735/855)、79.1%(641/810)和82.7%(691/836)的代谢物至少关联到1个mQTL,每个代谢物关联的mQTL数目从1个到7个不等,其中93、109和119个代谢物分别在灌浆期、成熟期和发芽期籽粒中关联到4个以上的mQTLs。在成熟期籽粒中检测到的1506个mQTLs中,分别有1415、70和21个位点对相应代谢物变化的贡献率小于20%、20%~50%和一半以上。此外,分别有1460和1488个位点对发芽期籽粒和灌浆期籽粒的代谢物变化具有20%以下的贡献率(图3a),并且分别有26个和39个mQTLs对发芽期籽粒和灌浆期籽粒的代谢物变化具有50%以上的贡献率。在灌浆期籽粒、成熟期籽粒和发芽期籽粒中分别检测到112、91和115个贡献率大于20%的mQTLs(图3a)。
研究人员发现MH63和ZS97在灌浆期、成熟期和发芽期籽粒的mQTLs在全基因组上的随机分布存在显著差异。富集mQTLs的区间可能含有大量控制积累代谢物的主效基因。在灌浆期籽粒、成熟期籽粒和发芽期籽粒中分别鉴定出41、42和35个潜在的热点mQTLs。成熟期籽粒和发芽期籽粒的热点mQTLs分别位于5、6号染色体和除3号染色体外的所有染色体上(图3b)。
当比较单个代谢物的mQTLs时,研究人员在三个不同时期籽粒中共同检测到的372个代谢物的2068个位点中发现了1804个不同的位点,表明这三个时期的大多数代谢物可能受到不同基因的控制。虽然在三个时期的籽粒中共同检测到了372种代谢物,但在每个时期共检测到了46个代谢物的70个相关mQTLs,其中灌浆期、成熟期和发芽期籽粒的16、14和16个代谢物分别检测到27个、24个和19个相关的mQTLs。虽然在两个不同时期的籽粒中检测到102个共有的mQTLs,但只有大约18%的代谢物在两个不同时期的mQTLs有重叠,其中成熟期籽粒和发芽期籽粒的代谢物占多数。此外,在所有三个时期的水稻籽粒中,218个共有代谢物的mQTLs也被检测出来。进一步的数据挖掘显示,48种代谢物的60个mQTLs在三个时期有重叠,例如11号染色体上与m2148含量相关的一个主效mQTL。不同发育时期单个代谢物的mQTLs重叠表明代谢物生物合成的遗传调控在不同发育时期是保守的。虽然超过一半的代谢物在至少两个时期有一个或多个mQTL(s)有重叠,但有96个代谢物在三个时期具有不同的mQTLs。例如,在成熟期籽粒中,m0476在3个时期都表现为主效的mQTL被定位在8号染色体上3.6Mb的区间内,LOD值为5.84。虽然这个主效mQTL与另外两个时期籽粒中的mQTLs没有发现重叠,但同一代谢物的mQTLs分别定位于发芽期籽粒和灌浆期籽粒11号和6号染色体上的1和1.8Mb区间内,LOD值分别为4.63和5.67(图3c)。这一发现揭示了一种依赖于发育阶段的代谢物生物合成控制方式。
3 mQTLs中候选基因的分析
为了确定控制MH63和ZS97籽粒代谢变异的候选基因,研究人员对基因组、转录组和代谢组数据进行了分析。为了确定籽粒在不同时期每种代谢物的共同调控因子,研究人员重点研究了那些跨不同时期具有重叠的mQTLs。例如,在所有三个时期中,MH63的阿魏酰5-羟色胺含量都至少是ZS97的两倍。阿魏酰5-羟色胺在7号染色体上共有一个0.34Mb的片段,并具有相对较高的LOD值(灌浆期籽粒、成熟期籽粒和发芽期籽粒的LOD值分别为15.2、17.1和23.9)。基于对代谢组学和代谢途径的分析,研究人员发现了包括编码糖基转移酶、甲基转移酶、乙酰基转移酶的基因,并鉴定了一个可能的乙酰基转移酶基因LOC_Os07g04970,该基因的产物可能控制阿魏酰辅酶A和5-羟色胺这两种底物的酰化反应。在MH63和ZS97的灌浆期籽粒中,LOC_Os07g04970的表达均高于发芽期籽粒,这与阿魏酰5-羟色胺的代谢迁移结果相一致。基因组序列分析显示,LOC_Os07g04970的编码区序列在MH63和ZS97之间有几个变异,这导致了三个氨基酸残基的替换。然而,替换的氨基酸并不在蛋白质的保守区。此外,在ZS97的启动子区域还发现了36bp的缺失。与MH63相比,ZS97中LOC_Os07g04970在黑暗中处理48h后的表达量增加了约14倍。因此,LOC_Os07g04970是控制阿魏酰5-羟色胺生物合成的候选基因,其启动子和编码区的遗传变异可能共同影响代谢物含量的变化。
此外,包括L-天冬酰胺在内的近100种代谢物在三个时期都有不同的mQTLs。L-天冬酰胺最主效的mQTL位于6号染色体上的0.79Mb区间内,其在发芽期籽粒中LOD值最高,为12.6。尽管在其它两个时期未发现与该主效mQTL重叠的mQTLs,但在成熟期籽粒和灌浆期籽粒中,同一代谢物的mQTLs分别定位于6号和9号染色体上的0.86和1.41Mb区间内,LOD值分别为8.3和4.3(图4a)。数据分析结果表明,LOC_Os06g03990是影响发芽期籽粒中L-天冬酰胺含量的候选基因。作为一种氨基转移酶,LOC_Os06g03990可能参与了从L-天冬酰胺到α-酮酸的氨基转移。LOC_Os06g03990在灌浆期籽粒中的表达高于发芽期籽粒,而发芽期籽粒的L-天冬酰胺含量较高(图2c),表明LOC_Os06g03990对L-天冬酰胺的积累有抑制作用。序列比对显示LOC_Os06g03990在MH63和ZS97之间有4个氨基酸残基的替换,其中一个位于转氨酶I类和II类结构域保守区(图4b)。LOC_Os06g03990在MH63和ZS97整个生育周期中的表达没有显著差异。因此,MH63和ZS97之间L-天冬酰胺含量的差异可能是LOC_Os06g03990蛋白序列变异的结果。研究人员用上述方法对所有检测到的代谢物的遗传决定因素进行了分析,并筛选到了35个候选基因,这些基因与30种已进行结构识别或注释的代谢物有关。(表1)。
4 利用渐渗系和转基因试验验证候选基因功能
为了验证与代谢变异相关的候选基因,对RIL群体中不同单倍型的代谢物含量进行了分析。例如,研究人员分别分析了包含MH63和ZS97单倍型LOC_Os07g04970的RILs中的106和97个品系的阿魏酰5-羟色胺含量。结果表明,阿魏酰5-羟色胺在MH63单倍型中的平均积累量是ZS97单倍型中的2.5倍。阿魏酰5-羟色胺含量和基因型关联分析表明,LOC_Os07g04970是阿魏酰5-羟色胺含量在RILs之间差异的原因。RILs也验证了与初级代谢物含量变异有关的候选基因。例如,在包含MH63单倍型LOC_Os06g03990的品系中,L-天冬酰胺的含量比包含ZS97单倍型的品系降低了20%(图4b),这初步证实了LOC_Os06g03990在L-天冬酰胺代谢变异中起遗传影响作用。
为了证实与L-天冬酰胺含量相关的候选基因LOC_Os06g03990在水稻体内的功能,将该基因导入ZH11中,构建了LOC_Os06g03990的过表达株系。表达分析证实该基因在T3代转基因水稻中过表达(图4c)。考虑到LOC_Os06g03990只影响发芽期籽粒中L-天冬酰胺含量的变化,因此研究人员对发芽后72h的水稻籽粒进行了代谢组分析。结果表明,转基因株系中L-天冬酰胺的含量不到野生型植株的一半(图4d),证实了LOC_Os06g03990在L-天冬酰胺积累中的抑制作用。此外,过表达LOC_Os06g03990显著增加了发芽期籽粒IIe、Phe、Pro、Trp、Lue、Val、His以及酪胺的含量。此外,一系列氨基酸如甘氨酸、精氨酸、酪氨酸、天冬氨酸和半胱氨酸在转基因株系中的积累水平下降(图4e)。这一结果表明,LOC_Os06g03990对氨基酸的生物合成具有整体性影响。
5 代谢物-代谢物网络及其与农艺性状的关系
为了研究受遗传变异影响的代谢物之间的协同调节,研究人员在RIL群体中对上述三个时期的代谢组进行了一系列相关分析,并计算了各时期鉴定出的性状之间的显著成对相关性(|r|≥0.5和P<0.0 1)。灌浆期、成熟期和发芽期籽粒中分别检测到5544、3481和5286个显著相关关系对。为了可视化大多数已被结构鉴定或注释的代谢物之间的最显著相关性,使用r≥0.7或r≤-0.5(P<0.0 1)的相关性数据构建了一个关联网络,包括氨基酸、核酸、脂肪酸、类黄酮、花青素、多胺、多酚和萜烯等代谢物。同一化学类别的代谢物或参与同一生化途径的代谢物往往表现出密切的相关性。例如,尽管在灌浆期籽粒中m0821和 m0823的相关性很高,但在其他两个时期,它们的相关值都低于0.5。虽然同一代谢物在不同时期的相关值有很大差异,但也发现了跨时期的保守相关性。例如,m0344和m1494在三个时期都显示出很强的相关性(r>0.95) (图5a-c)。
代谢物水平的变化是植物性状变化的主要原因之一。许多mQTLs很可能是引起表型变化的原因。首先,研究人员研究了抽穗期(HD)、粒长(GL)、粒宽(GW)、千粒重(KGW)、每穗粒数(GN)、每株分蘖数(TP)和单株产量(YD)等农艺性状与各时期代谢产物水平的相关性,并建立了代谢物-农艺性状相关网络。结果显示,147种代谢物与7个农艺性状共鉴定出233个显著相关关系对,其相关系数在0.63~0.68之间。对于每个农艺性状,参与的代谢物数量从1(GN)到130(HD)不等,平均值为29.3。此外,对于每种代谢物,与其紧密相关的农艺性状数量变幅为1~3,平均值为1.39。这些结果表明不同农艺性状与这些代谢物之间关系的复杂性。大部分代谢物-农艺性状的相关性在三个时期不同,说明发育时期对代谢物-农艺性状的相关性有影响。例如,灌浆期、成熟期和发芽期籽粒中各有37、92和25种代谢物与HD显著相关。然而,在某些情况下,同一农艺性状在不同时期检测到了与相同代谢物的相关性。此外,该研究还发现一些代谢物与多个农艺性状密切相关。m1931与HD、GL、GW和KGW四个农艺性状相关(图5d)。为了解释复杂性状和相关代谢物变异之间的遗传和分子基础,研究人员分析了代谢物和农艺性状的mQTLs和pQTLs之间的共定位。分布在6、7和11号染色体上的三个HD QTLs与这三个时期,特别是与成熟期籽粒中至少一个代谢物的mQTLs有重叠(表2)。进一步分析发现,Ghd7.1基因位于7号染色体上与水稻HD相关的QTL区间内。这一结果暗示Ghd7.1基因在协同调节HD和代谢物积累方面具有潜在的作用。
结论
本研究分析了水稻籽粒在不同发育时期的代谢变化,包括灌浆期籽粒、成熟期籽粒和发芽期籽粒。此外,该研究利用ZS97与MH63杂交获得的210个个体组成的RIL群体破译了MH63和ZS97在不同发育时期籽粒代谢物的差异及其遗传决定因素。结合mQTLs分析结果,该研究对与30个已知代谢物相关的35个候选基因进行了鉴定,其中控制阿魏酰5-羟色胺生物合成和L-天冬酰胺含量的基因通过转基因检测得到了进一步的验证。此外,利用三个时期籽粒中代谢物与农艺性状的相关性,建立了代谢物-农艺性状网络,并结合mQTLs分析和pQTLs分析,揭示了由代谢物和农艺性状组成的复杂性状的遗传基础。
评价
本研究利用广泛靶向代谢组研究与QTL定位技术相结合,并以分子生物学试验加以辅助,显着提高了我们对水稻籽粒代谢组在不同时期的遗传变异和生化基础的认识,并为水稻在保持较高营养水平的同时提高产量的育种策略提供了深刻的见解。