科研 | Plant Physiology:大麻中大麻素和萜类化合物积累的基因网络

编译:永稷,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

腺毛是一种特殊的解剖结构,可在植物与环境的相互作用中积累具有重要生物作用的分泌物。这些分泌物在风味、香味和制药行业也有商业用途。位于雌花苞片表面的有头状柄的腺毛状大麻是生物合成和储存富含大麻素和萜类化合物的树脂的主要场所。在本研究中,研究者以味道、颜色、气味和遗传起源等各不相同的9种大麻品种作为供试材料,分离出毛状体(腺毛),并测定得到细胞特异性转录组数据集以及花蕾中大麻素和萜类化合物的含量。对转录组和代谢组数据进行分析发现这些数据集可提供大量信息来对这些品种进行高分辨率的区别。通过WGCNA分析方法揭示了一个与大麻素和萜类化合物生物合成相关基因的共表达网络。进一步通过大麻测定实验室常规测定对大麻中与单萜和倍半萜类化合物生物合成相关的萜类合成酶基因进行了鉴定和功能验证,除了对已报道的柠檬烯合成酶基因(CsTPS14CT)和月桂烯合成酶基因(CsTPS15CT)进行突变体克隆外,研究者还对功能验证得到的大麻中先前未报到过的酶基因进行了突变体克隆,它们分别是橙花叔醇或芳樟醇合成酶基因(CsTPS18VF 和CsTPS19BL)、大根香叶烯B合成酶基因(CsTPS16CC)和异丁香醇合成酶基因(CsTPS20CT)。这项研究为进一步了解商业大麻品种间树脂积累的复杂的化学和生化反应奠定了理论基础。

论文ID

原名:Gene Networks Underlying Cannabinoid and Terpenoid Accumulation in Cannabis

译名:大麻素和萜类化合物在大麻中积累的基因网络

期刊:Plant Physiology

IF:6.305

发表时间:2019年8月

通讯作者B. Markus Lange

通讯作者单位:华盛顿州立大学生物化学研究所和M.J.默多克代谢组学实验室

DOI:https://doi.org/10.1104/pp.18.01506

实验设计

本文以性状不同的9种大麻品种(Sour DieselCanna Tsu, Black Lime, Valley Fire, White Cookies, Mama Thai, Terple, Cherry Chem, 和Blackberry Kush)作为供试材料。在温室大棚中进行盆栽试验,对不同品种采取不同的光照处理来促进其生长和开花,当大麻腺毛一致性的从混浊的白色转变为透明的时候和转变为类似琥珀色期间进行植株收获,或者是雌蕊的颜色从白色变为黄色或橙色的时候。采收到的花蕾,用剪刀将颜色不一致的腺毛剔除,样品冷冻保存备用(整个收获过程在3 h以内完成)。首先,分别采用RNeasy Plant kit (Qiagen)和SuperScript III Reverse Tran-scriptase kit (Invitrogen)试剂盒进行样品RNA的提取和cDNA文库的构建,最终得到所有样品的转录组数据集,并采用WGCNA分析方法进行基因共表达网络的构建关键基因模块的筛选;然后,用10 mL甲基叔丁基醚对2 g植物材料进行2次以上的浸提,浸提液分别通过HPLCGC分析技术进行大麻素类萜类化合物含量测定,并采用PCA和OPLS-DA等方法建立代谢产物表达量与样品类别之间的关系模型;最后对筛选得到的差异基因进行克隆和功能验证

结果

1 基于RNA-Seq数据的品种分类
对基于RNA-seq的转录组数据进行主成分分析(PCA),结果表明:前三个主成分占数据集变异率的83%。在三维的主成分分析图中,每个品种的三个生物学重复聚集在一起,而每个品种的成分组成与其他品种的重复分离,表明每个品种的所有转录组数据都是独特的(图3A)。通过分层聚类分析(HCA)对RNA-seq数据进行处理,建立分层聚类的系统树图(图3B)。其中,第一个类别主要包括:Blackberry Kush,Cherry Chem,和Terple三个品种,第二个类别主要包括Mama Thai,White Cookies,Valley Fire,Black Lime,Canna Tsu和Sour Diesel六个品种,表明通过遗传关系可以将品种进行清晰的分类。
图3. 基于腺毛特异性RNA-seq数据对大麻品种的分类。
A. 主成分分析(PCA)三维图;
B. 二维层级分析热图。红、白、蓝颜色及数值表示与所有品种平均基因表达量值相比的log2倍变化。
各个大麻品种缩写为:BB表示 Blackberry Kush;BL表示 Black Lime;CC表示Cherry Chem;CT表示Canna Tsu;MT表示Mama Thai;SD表示Sour Diesel;T表示 Terple;VF表示Valley Fire;WC表示 White Cookies。
基于代谢组数据的品种分类
6种大麻素化合物进行分析,结果表明:总体而言,大麻素的浓度在White Cookies (占到花芽干重的28.4%)中的含量最高,在Mama Thai (6.4%)中的含量最低。其中,四氢大麻酚酸(THCA)作为主要的大麻素类物质,在White Cookies品种中的含量达到最高,占其花芽干重的26.3%,在Mama Thai品种中的含量最低,占其花芽干重的5.9%;唯一例外的是,Canna Tsu中大麻二醇酸(CBDA)的含量较四氢大麻酚酸(THCA)的含量高,但在其他品种中大麻二醇酸(CBDA)的含量仅为其花芽干重的1%或者更少;两种额外相对高丰度的大麻素是大麻酚和四氢大麻酚,它们在个品种中的含量分别占到花芽干重的0.2%-1.7%和0.2%-1.6%;大麻色原烯在所有供试品种中均未检测到(表1)。
24种萜类化合物进行分析,结果表明:总体而言,萜类化合物含量在Black Lime (占花芽干重的8.8%)中的含量达到最高,在Sour Diesel (1.8%) 和Mama Thai (0.7%)中的含量相对较低,且单萜类化合物与倍半萜类化合物的比值通常很高,仅有三个品种的比值低于3。其中,月桂烯是大多数品种中含量最高的单萜类物质,异松油烯是Mama Thai中含量最高的单萜类物质(但也只有0.1%),柠檬烯在White Cookies(1.5%)、Black Lime (0.9%) 和 Valley Fire (0.7%)中的含量较高,a-松萜和b-松萜在Black Lime中的含量较高,桉树酚在Canna Tsu 和 Cherry Chem中的含量很高,所有其他单萜类化合物的浓度都小于0.2%;所有品种都含有倍半萜类,其中石竹烯是含量最高的倍半萜类物质,草烯在所有品种中均可检测得到,但是Black Lime是唯一一个橙花叔醇含量超出限制的品种(表1)。
代谢组数据的主成分分析结果可以将所有品种进行清晰的分级,每个生物学重复紧密的结合在一起。值得注意的是,所有类型数据变量的99%都归于前三个主成分(图4A)。正交偏最小二乘判别分析(OPLS-DA)可将品种分为两个群组,一个群组代表印度大麻C. indica品种另一个群组代表C. sativa品种(图4B)。每个品种的生物学重复再一次聚在一起,品种间存在显著的分离。总而言之,依据大麻基因组和代谢组所进行的品种分类结果一致
表1 大麻雌蕊花蕾组成(9种大麻品种中代谢产物占其花蕾干重的百分比)
图4 基于大麻素类和萜类化合物数据对大麻品种的分类。
A. 主成分分析(PCA)三维图;
B. 正交偏最小二乘判别分析(OPLS-DA)二维图。
3 大麻素和萜类化合物合成路径共表达验证
通过R语言中的加权共表达网络分析包对所有品种的基因丰度进行评价,最终形成7个共表达基因模块,并运用moduleEigengenes函数进行进一步的分析。在大麻素类化合物合成途径中基因代谢产物相关关系分析结果表明:Canna Tsu品种中标志性的大麻素-大麻二醇酸(CBDA)的积累与一个共表达模块高度相关,该模块可通过编码大麻二醇酸(CBDA)合成酶的生成,进而将大麻萜酚酸转化为大麻二醇酸(CBDA),有助于研究者了解大麻二醇酸(CBDA)的积累机制。除大麻二醇酸(CBDA)大量积累的Canna Tsu品种外,四氢大麻酚酸(THCA)合成酶基因的模块在其他品种中是大量存在的,该基因在大麻素合成路径中会通过调控四氢大麻酚酸(THCA)合成酶的形成,从而为大麻素合成相关基因的发现奠定基础。
在萜类化合物合成途径中的基因与代谢产物的相关关系分析结果表明:两个共表达基因模块(图5 A黑色和黄色)与月桂烯的合成相关(图5 B),通过CsTPS3FN基因所编码的单萜合成酶可合成月桂烯。类似的基因与代谢产物的表达调控还包括:CsTPS1FN与柠檬烯、CsTPS2FN与α-蒎烯和β-蒎烯、CsTPS6FN与b-蒎烯以及CsTPS9FN与木脂烯。在研究者的数据组中CsTPS5FN、CsTPS4FN 、CsTPS8FN和CsTPS13PK的表达在阈值之下,相对应的萜类代谢产物在各个品种中也未检测到,说明剩余基因的表达足以说明主要萜类化合物存在。此外,芳樟醇和橙花叔醇也被排除在外,因为迄今为止还没有从大麻中鉴定到相关的萜类合成酶基因。值得注意的是,与这些萜类化合物形成相关基因的克隆和功能验证也是本研究的一部分,这将有助于对萜类化合物多样的理解。
黄色模块是研究者对大麻素和萜类化合物合成途径中的基因到代谢产物进行分析的主要模块。GO分析表明,在黄色模块中有大量与萜类化合物合成相关的基因,共有22基因通过编码四氢大麻酚酸(THCA)合成酶来将代谢前提物质转化为大麻素和萜类化合物终产物(图5C),这些基因还编码与糖酵解MEP途径相关的酶,从而参与形成GPP以及最终的单萜类化合物、倍半萜类化合物和大麻素类化合物(图5D)。
图5大麻素类和萜类化合物生物合成基因的共表达。
A. 利用WGCNA 方法将腺毛RNA-seq数据分为8个颜色模块;
B. WGCNA模块与代谢产物之间的相关性,用不同颜色对每个代谢模块进行SCCs可视化呈现,红色表示阳性,蓝色表示阴性;
C.通过WGCNA获得的黄色共表达模块中与大麻素类和萜类化合物生物合成相关的基因,颜色表示不同路径:亮蓝色为六烯酸形成、深绿色为单烯类的前体、浅绿色为单烯类的合成酶、橙色为倍半烯类、深蓝色为大麻素类、青色为剩余基因。
D. C图中突出强调的基因在一个简单代谢路径中的功能。
4 目标基因的鉴定及功能分析
以GPP(geranyl diphosphate)、NPP(neryl diphosphate)、tFPP(2-trans,6-trans- farnesyl diphosphate)和cFPP(2-cis,6-cis-farnesyl diphosphate)作为底物,进行萜类化合物合成酶的分析。首先,从Canna Tsu品种cDNAs文库中成功克隆出单萜类中的月桂烯合酶(CsTPS15CT)和柠檬烯合酶(CsTPS14CT)基因,并以GPP为底物时,产生了对应的月桂烯(CsTPS15CT)和柠檬烯(CsTPS14CT)(图7A和B)。然后,从Valley Fire品种和Black Lime品种中分别克隆出倍半萜类中的橙花叔醇合酶和芳樟醇合酶双功能的CsTPS18VF和CsTPS19BL基因,当以GPP为底物时,两个基因均会产生芳樟醇(图7C和D);当tFPP为底物时,两个基因均会产生橙花叔醇(图8A和B)。最后,为了进一步研究大麻产生多种萜类化合物的遗传潜能,选择CsTPS16CC 和 CsTPS20CT基因进行克隆和功能验证。从Cherry Chem品种中克隆得到别香橙烯合酶基因(CsTPS16CC),当以tFPP为底物时,产生了大根香叶烯 B(图8C);从Canna Tsu品种中克隆得到δ-芹子烯合酶基因(CsTPS20CT),但以tFPP为底物时,产生了异丁香醇热降解产物乙二酚(图8D)。总而言之,本文中所述的资源和方法可用于进行候选基因的鉴定和功能验证,有助于更好的了解大麻中萜类化合物多样性的基因簇。
图7 以GPP为反应底物的大麻萜类化合物合成酶的功能验证。左边:气相色谱扫描(GC);中间:初级代谢产物MS图谱;右边:产物分布。
A. 柠檬烯合酶 (CsTPS14CT);
B. β-月桂烯合酶(CsTPS15CT);
C. (E)-橙花叔醇/(1)-芳樟醇合酶(CsTPS18VF);
D. (E)- (E)-橙花叔醇/(1)-芳樟醇合酶(CsTPS19BL)。
图8 以tFPP为反应底物的大麻萜类化合物合成酶的功能验证。左边:气相色谱扫描(GC);中间:初级代谢产物MS图谱;右边:产物分布。
A. (E)-橙花叔醇/(1)-芳樟醇合酶(CsTPS18VF);
B. (E)-橙花叔醇/(1)-芳樟醇合酶(CsTPS19BL);C. 大根香叶烯 B 合酶(CsTPS16CC);D. δ-芹子烯合酶(CsTPS20CT)。

讨论

本研究基于RNA-seq转录组数据将9个大麻品种分为两类。该方法已经被成功用于多种作物,包括苜蓿、玉米和小麦。本论文的数据组也对后续大麻研究资源的建立具有很高的价值。此外,RNA序列数据也可被用于基因的表达分析,从而提供功能数据库。除了用基因分类的方法外,本论文还利用大麻素和萜类化合物数据对9种商用大麻品种进行了分类。两种独立的数据统计方法,主成分分析(PCA)和正交偏最小二乘判别分析(OPLS-DA)结果发现,每个品种的三个生物学重复聚集在一起,而品种之间仍然是分离的。近期,已有学者提倡用大麻素和萜类化合物数据进行品种分类。该方法优于仅仅使用大麻素数据进行分型的关键优势在于大麻中多种萜类化合物的大量积累,这将显著增加数据统计分析的准确性。它也反映了许多用户根据四氢大麻酚(THC)和芳香味进行大麻品种挑选的事实。
运用权重基因共表达网络分析方法进行数据分析,结果表明生物合成基因与大麻素和萜类化合物等终产物之间的相关性。研究者最近对多种大麻品种腺毛中的基因表达网络进行了宏基因组分析。其中一个结论是:基因的表达形式与代谢物的专一性形成之间完全相关,这与本论文数据结论一致。特异性代谢产物的多种合成途径可被某些基因共同调控。比如:大麻素和萜类化合物,单萜和双萜,芳香性物质和酰基糖,苦味酸和异戊二烯基类黄酮。这些紧密的基因到代谢化合物的相关关系也是通过相关途径进行通路预测的反映。相反,基因表达形式无法通过中心碳代谢进行通路预测,但在蛋白水平的调控中具有主要的作用。这并不意味着在腺毛中特殊代谢产物的反馈调控是可以忽略的。基因与代谢物之间存在着一种特别强的整体相关性,揭示其中的细节将是未来研究的一个突破点。
Booth等人通过对Finola 和Purple Kush大麻品种的转录组分析获得了萜类化合物合成酶的候选基因,后续功能验证发现其可以编码14种单萜和倍半萜类化合物合成酶。一直以来,一些常见单萜和倍半萜类化合物合成(比如柠檬烯、蒎烯、石竹烯和蛇麻烯)的基因在所有品种中均会高度表达,而产生不常见产物的基因只在少数品种中表达或不表达,本研究通过构建克隆载体和异源表达的方式对这些常见和不常见基因的功能进行了深入研究。Canna Tsu品种中,CsTPS15CT和CsTPS14CT所编码的酶会促使GPP产生月桂烯和柠檬烯;Black Lime 品种中,CsTPS19BL编码的酶会促使GPP产生1-柠檬酸和2-柠檬酸的混合物以及促使tFPP产生橙花叔醇。同时,从Valley Fire品种中克隆出一个同源序列,并对其序列变异结果进行了评价。值得注意的是,CsTPS18VF基因所编码的酶与CsTPS19BL所编码的酶具有相同的特异性,都是以tFPP为底物进行的反应,但如果以GPP为底物进行反应时,就会有大量的芳樟醇产生。由于氨基酸序列仅有3个错配,其呈现出非常强的特异性。最后,研究者基于序列相关性进行了之前未报道过的倍半萜类化合物合成酶基因的基因克隆。发现CsTPS16CC会产生大根香叶烯B,CsTPS20CT会形成异丁香醇作为初级产物。在CsTPS16CC和CsTPS20CT基因表达的实验中,也可检测到榄香烯和橄榄醇,这两种化合物都是已知的热裂解化合物,后来根据这两个基因所编码酶又将其称之为大根香叶烯B酶和异丁香醇酶。据目前所知,有萜类化合物合成酶所编码的倍半萜类化合物在大麻样品中还未见报道,说明需要对萜类化合物进行深入的分析来更好的理解品种特异性芳香机制。

结论

长期以来,大麻所产生的次级代谢产物在临床使用中发挥了重要的作用。然而,如何从众多大麻品种中获得产率较高的特定活性化合物以及进行活性次级代谢产物的挖掘仍未可知。本文利用基于RNA-seq的转录组和代谢组两种方式对商用大麻品种进行了准确的分类,并在分类基础上构建了商用大麻品种中大麻素类和萜类化合物合成的共表达网络,最后对已知和未知萜类化合物合成酶基因进行了功能验证。这不仅为大麻次级代谢产物的挖掘、合成机制及高产率提取奠定了理论基础,同时也为我们今后利用多组学数据解释生物学问题提供了思路。


(0)

相关推荐