科研 |Science:性别对人类组织基因表达的影响

编译:小北,编辑:景行、江舜尧。

原创微文,欢迎转发转载。

导读

许多包括疾病在内的复杂人类表型,表现出性别差异的特征。这些性别差异不同程度的归因于激素、性染色体、基因型×性别效应、行为差异以及环境暴露的差异。然而,它们的机制和潜在的生物学意义尚不清楚。基因表型-组织表达项目(GTEx)为探究之前没有描述的组织在人类转录组上性别差异的普遍性和遗传机制提供了机遇。研究者在GTEx项目中44个人类组织资源中通过分析16,245个RNA-seq的样本以及838个成人的基因型,构建了一系列基因表达及其基因调节的性别差异。37%的基因在至少一种组织中表现出性别偏倚表达。通过整合性别偏倚的eQTLs与全基因组关联分析的数据,研究者鉴定了58个基因-性状关联在单性别中受基因表达调控驱动。该项工作对人类转录组及其调节机制的性别差异进行了广泛的描述。

论文ID

原名:The impact of sex on gene expression across human tissues

译名:性别对人类组织基因表达的影响

期刊:Science

IF:41.845

发表时间:2020年9月

通讯作者:Barbara E. Stranger

通讯作者单位:芝加哥大学

DOI号:10.1126/science.aba3066

实验设计

为了描述人类转录组及其调节过程中性别的差异,并且探究性别和基因组如何相互作用影响复杂的特征和疾病,研究者在GTEx项目中44个人类组织资源中通过分析16,245个RNA-seq的样本以及838个成人的基因型,构建了一系列基因表达及其基因调节的性别差异(图1)。研究者报道了在基因表达、组织细胞类型构成以及顺式表达的数量性状位点(cis-eQTLs)上的性别差异。为了探究它们的影响,研究者将这些结果与基因的功能、转录因子结合注释以及87个GWASs汇总统计的全基因关联研究(GWAS)。

图1. GTEx v8中研究性别差异的样本、数据类型以及发现集簇。图中展示的组织类型包括11个不同的大脑区域以及2个细胞系,样本数量来自GTEx v8基因型捐赠者,并且用色条表示。本研究包含44个组织来源,存在于两性中的样本≥70。组织来源包括2个细胞系、40个组织以及2个复制的大脑小脑和皮质组织。

结果

1 性别对基因表达的影响是普遍存在的但是效应微小

利用GTEx v8的数据,研究者对至少一种组织中性别偏倚表达的基因进行定量,结果发现35431个X相关以及常染色体的基因,包括蛋白编码、长链基因间非编码的RNA(lincRNA)以及其他很少被描述的基因类型例如转录的伪基因。对于每一个组织,研究者首先拟合了一个线性模型解释已知的样本、供体特征以及能够捕获隐藏技术或者生物因子的替代变量,包括组织细胞类型的构成。因此研究者能够鉴定性别偏差的基因表达,而不是来自细胞类型丰度的性别差异。 下来在所有组织中模拟了性别偏倚,结果发现13294个差异表达的基因,并且在每个组织中发现473/4558个基因,占所有检测基因的1.3%-12.9%(图2A)。之前的研究报道了大量性别偏倚的基因表达并且将乳腺描述为性别差异最大的组织。然而研究者在组织细胞类型构成中控制性别差异后并没有观察到这一结果。研究者在四个组织(小脑、大脑皮层、心脏左心室和淋巴细胞)的独立基因表达数据集中评估了性别偏倚基因的复制程度,观察到中度到强度的复制。总之,37.5%的人类转录组在至少一个组织中差异表达。其中531个基因(4%)是X相关的,12763个基因(96%)是常染色体的,分别代表47%和37%的X相关和常染色体基因。尽管丰度很大,但是性别的影响大部分很小,特别是常染色体的基因。在女性中高表达的X相关基因表现出更大的性别效应,可能是在X染色体失活中逃脱的结果(XCI)。性别偏倚基因的数量和效应大小并不是由性别主导的。

图2. 性别偏倚的基因表达。(A)每个组织中性别偏倚表达基因的数目,组织颜色如图1所示;(B)性别偏倚基因的发现以及性别偏倚基因的表述可作为组织中共有的功能,X染色体相关以及常染色体性别偏倚基因的比例如图所示;(C)基于基因表达和性别偏倚基因的效应大小对组织进行层次聚类。

2 性别偏倚基因的表达大多数是组织特异性的

性别偏倚基因在组织共享中表现为一种倾斜的图谱,它们可能仅在一小部分组织亚群中差异表达(图2B)。在13294个性别偏倚的基因中,2416个基因(18.2%)仅在一个组织中差异表达(图2B),提示它们依赖组织的调节,只有30个基因(0.23%)在44个组织资源中表现为一致的性别偏倚,其中22个是已知的结构性XCI逃逸。这种组织特异性并不能简单的反映组织间的基因表达图谱,性别偏倚的基因倾向于在组织间广泛表达,而性别偏倚的表达并不局限于一个或几个组织(图2C)。在两个或更多组织中性别偏倚的大多数基因在组织间具有一致的效应方向,特别是X相关的基因。在全血和细胞系中研究广泛的生物样本类型并不代表组织间性别偏倚的表达,在全血中性别偏倚的基因仅占12.9%。尽管基于基因表达和性别偏倚表达对组织的层次聚类是高度一致的(图2C),聚类定义的基因集交叉小于期望值。例如,基因表达和性别偏倚表达说明大脑亚区的集簇明显不同于与其他组织(图2C)。然而基于性别偏倚表达的聚类是由194个基因驱动的,而基于转录组学大脑的聚类是由982个基因驱动的,只有6个基因在那些定义的性别偏倚的大脑集簇中常见。在性别偏倚的肝脏集簇驱动因子中研究者鉴定了CYP450基因——CYP1A2, CYP3A7,, CYP3A4,但是研究者也发现了对于性别偏倚没有好好描述的基因,例如PZP, H19以及VWCE,之前有报道称由于DNA甲基化上肝脏特异性别差异导致性别差异表达,这些结果提示性别偏倚表达的组织特异性并不是主要由组织特异性基因表达驱动的。

3  X相关女性偏倚的基因能够准确预测性别且提示组织特异性的基因在X染色体失活中逃逸

正如之前报道的,在梯度增强树中利用X相关的基因能够从基因表达中准确的预测性别。尽管大部分预测的X相关基因是那些从XCI中逃逸的基因,研究者鉴定了40个X相关女性偏倚的基因,能够预测性别并且不是之前描述的XCI逃逸基因。这些结果提示这些潜在的XCI逃逸基因需要进一步评估,研究者不能直接检测XCI逃逸并且X相关基因的女性偏倚表达可能来源于其他机制。从常染色体基因上对性别预测的准确性、特异性都低于基于X相关基因的预测,并且需要更多的基因。然而在乳腺和肌肉两个组织中,常染色体基因预测性别的特异性≥ 90%,敏感性≥ 98%。

4 性别偏倚基因表现为非随机且组织特异性的基因组分布

X染色体上除了女性偏倚基因的富集,对性别偏倚基因的全基因组分布知之甚少。研究者利用一种位置基因富集分析的方法对男性和女性偏倚的基因进行了分离。结果发现在134个常染色体和5个X相关区域上共有1559个性别偏倚的基因聚类(图3A)。正如之前报道的,在X染色体上,拟常染色体区域PAR1和X染色体断臂p上的剩余区域分别富集有男性偏倚的以及女性偏倚的基因(图3A)。女性偏倚基因的富集在断臂p更年轻的区域更强,可能是由XCI逃逸驱动的。尽管富集的X染色体区域横跨~126 Mb,在至少2/3的组织中仅有25%的亚区域是富集的。在常染色体性别偏倚的基因中,研究者观察到在70%的组织(30/44)中鉴定的20号染色体上男性偏倚基因的集簇,但是134个常染色体富集的区域大多数是组织特异性的,平均在~7% (3/44)的组织中被鉴定。这些结果与可变的XCI组织逃逸以及组织特异的拓扑关联结构域兼容,可能受激素介导。需要进一步证实这些以及其他的假说,因为观察到的图谱可能是从各种各样的机制中产生的。

图3. 性别偏倚基因的调节机制和生物学功能。(A) 性别偏倚基因的基因组位置富集,在所有染色体(左)和X染色体(右)上男性(蓝色)和女性(红色)偏倚基因如图所示,每个边缘的高度代表共同显著富集的信号,从1-44变化;(B) 性别偏倚基因启动子区域转录因子结合位点(TFBS)富集,男性偏倚和女性偏倚基因的富集图谱展示了在所有组织中差异最大的前40个基因;(C)在组织中女性(红色)或者男性(蓝色)高度表达基因的富集集簇,球的大小对应GSEA所有组织元分析对应的p值,与球连接的虚线表示基因组间共有的基因。

5 性别偏好基因启动子区域富集激素相关及其他转录因子结合位点

研究者猜想转录因子(TF)的活性可能驱动差异表达图谱,因为近期已经有报道称性别偏倚基因受TFs调节,TFs促进了性别偏倚的进化改变。研究者通过ChIP-seq对男性和女性偏倚基因启动子区域231个TFs的TF结合位点(TFBSs)的富集进行了检测。研究者发现共计92个TFs的TFBSs富集,其中两个是X相关的基因(AR, ELK1)。54个TFs的TFBSs在女性偏倚的基因上富集,60个TFs在男性偏倚的基因富集,且有22个TFs在两个基因集中富集。这92个TFs包括(i)已知激素相关的TFs,雌激素(ESR1)、雄激素(AR)以及糖皮质激素受体(NR3C1);(ii)与类固醇受体共定位的10个TFs;(iii)没有报道的或者没有被描述与激素相关的TFs,包括SP1, E2F6,NRF1,KLF9以及SP2,前五个TFs与TFBS在组织中的富集一致。

在男性和女性偏倚的富集图谱中观察到的最大差异分别是在大多数组织,女性偏倚中SP2, SP4,NFYB, TWIST1,以及STAT5B的TFBSs,和男性偏倚中HNF4G, NFKB1,E2F6, HNF4A,以及ETS1的TFBSs。相反,研究者观察到一些TFs的TFBSs组织特异性的富集,例如分别在大脑和乳腺组织中的RFX2和ETV4(图3B)。尽管STAT5B和HNF4A在身体生长率和肝脏基因表达的性别差异上发挥已知的作用,但是在所有组织中它们的的作用以及性别偏倚知之甚少。性别对大多数剩余TFs的影响尚不清楚。总之,这些结果提示激素相关的TFs调节性别偏倚的表达,同时也提示其他的TFs在一些性别偏倚基因表达案例中以组织特异的方式发挥作用。值得注意的是,TFBS富集并不是由TFs自身性别偏倚的表达驱动的,与观察一致,基因性别偏倚的TF靶向不依赖于性别偏倚基因的表达。然而,如果这些差异发生在更早期的发育时间点,这一设想不能被丢弃,并且可能转化为一个更加结构性的性别偏倚TF结合图谱。或者,其他机制中涉及的TFs可能是因果驱动因子。

6 性别偏倚基因参与高度多样性的生物学功能且提示表观遗传标记性别特异的沉积

为了探究性别偏倚基因对细胞功能的影响,研究者考虑到性别的方向效应,在每个组织中进行了GSEA分析。为了证实基因组在多个组织中富集,研究者利用Fisher’s结合概率检验进行了元分析,并且鉴定了2134个富集的基因集。研究者利用团体检测的方法鉴定了富集基因集的共同特征,并且定义了36个集簇。在高分值的集簇中,研究者鉴定了基因富集的信号通路包括药物和激素应答、表观遗传学标记、胚胎发育和组织形态发生、受精、有性生殖和精子发生、脂肪代谢、癌症、免疫应答以及其他功能(图3C)。高分值的集簇对应PRC2和H3K27me3的靶向,主要由女性偏倚的基因驱动,该图谱也适用于其他表观遗传修饰。PRC2复合体能够诱导基因沉默并且参与XCI。H3K27me3性别特异的沉积在之前就有过报道,导致哺乳动物胎盘和成人肝脏性别偏倚的基因表达。已经有假说这些差异在胎盘糖基转移酶OGT和脑垂体生长激素的分泌中受性别差异的调节。本研究中H3K27me3与组织中性别偏倚表达之间的关联在之前并未报道。研究者也证实与药物代谢相关的集簇包括CYP450基因。在肝脏中CYP450性别偏倚的表达已经有报道,并且与性别偏倚的生长激素图谱相关。研究者在其他组织中也观察到了性别偏倚的表达。性别偏倚表达同样在性腺组织功能相关的集簇中鉴定,其中包含大量在睾丸中表达的基因。在配子形成和胚胎发生来源的成人组织中观察到交联组织性别偏倚表达图谱也是可能的。总之,这些结果提示性别偏倚的基因参与广泛的生物学功能和信号通路,其中的一些在之前并未报道与性别差异有关。

7 性别和疾病影响组织细胞的构成

GTEx组织样本是异质细胞类型的混合,同时带有个体和组织间的变化。在全血中,不同性别的细胞类型构成不同,但是性别对其他组织构成的差异知之甚少。利用t检验,研究者对每个GTEx组织中细胞构成的性别差异基于7个细胞类型的最终丰度进行了检测,结果发现在三个组织的四种细胞类型——角质细胞、中性粒细胞、脂肪细胞和上皮细胞中差异显著(FDR ≤ 0.05)。研究者猜想在本研究中存在其他未描述的细胞类型可能影响GTEx组织中细胞类型的构成,特别是免疫细胞,之前已经有报道称免疫细胞丰度中具有显著的性别差异。为了探究疾病中细胞的丰度,研究者对GTEx组织样本从病理角度进行了组织注释。结果发现六个病理表型与改变的细胞组织构成。总之,这些结果提示性别与组织细胞构成相关,并且疾病可能以性别偏倚的方式或者性别特异的病症改变细胞的丰度。

8 基因调控的性别偏倚具有高度的组织特异性,并且相对于性别对基因表达的影响并不常见

性别偏倚的人类表型和疾病特征可能部分源自性别偏倚的基因效应,其中一些对基因的表达具有影响。对于GTEx v8项目性别结合cis-eQTL分析鉴定的491,694个条件独立的cis-eQTLs,研究者在两个性别的44个组织中进行了性别偏倚的cis-eQTL分析(图1)。研究者利用一个包括基因型、性别和协变量的线性回归模型,检测了基因型×性别(G×Sex)相互作用对表达的重要性。重要的是,该方法能够捕获源于性别和性别相关基因的G×Sex相互作用,包括细胞类型的丰度或者环境因子。尽管细胞类型的异质性对sb-eQTLs的影响目前还不清楚,研究者在组织细胞类型构成中观察到了性别的差异,可能影响sb-eQTL的发现。因此,研究者描述了细胞类型特异的eQTLs对sb-eQTLs的影响,结果发现369个sb-eQTLs,对应366个基因(FDR ≤0.25)。大多数sb-eQTLs在乳腺组织 (261 sb-eQTLs) 中发现,同时在肌肉(36 sb-eQTLs)、皮肤(18 sbeQTLs)以及脂肪组织(14 sb-eQTLs)中也有发现(图4A)。总之,sb-eQTLs展示了组织特异性的有力证据,尽管只有一个sb-eQTL在两个组织中显著,且只有21%在一个宽松的显著性阈值内表现出组织共享(PG×Sex ≤ 0.01)。与近期观察结果一致,只有36个sb-eGenes (14%)在发现组织中表现出性别偏倚表达。这与小的sb-eQTL效应兼容,没有转化为显著的性别偏倚基因表达,或者具有不同的功能机制导致每个性别偏倚的类型。

为了对sbeQTLs提供其他的证据支持,研究者利用两种方法评估了性别间差异的等位基因特异性表达(ASE):通过广义线性模型(EAGLE)的等位基因差异倍数(ASE aFC)以及环境中的ASE。等位基因特异性表达是异质性个体顺式调控的基因效应导致的。因此差异的ASE提示条件特异的顺式效应,包括性别的特异性。研究者观察到这两种方法,尽管局限于异质性个体或者研究方法的差异时能力有限,但是也说明检测到的一部分sbeQTLs与ASE中的性别差异对应:sb-eQTLs在性别偏倚的ASE aFC上能够富集,并且与EAGLE关联。通过ASE aFC和EAGLE方法分别检测的243和163个sb-eQTLs中,有65个(26.7%)通过ASE aFC得以验证,有29个 (17.8%)通过显著的EAGLE关联得以支持,并且16个sb-eQTLs(10.4%)通过两种方法得以支持。

由于大多数sb-eQTLs在乳腺组织中被发现,并且与之匹配的有力数据库并不存在,因此研究者受限于对sb-eQTLs进行复制。研究者进行了内部验证,将GTEx乳腺样本分为发现和验证集群,并且发现了适中的复制。研究者接下来在一个独立且更大的全血eQTL数据库中评估了sb-eQTL的复制,包括DGN和GAIT2,结果观察到了微弱的复制。极少的sb-eQTLs复制在之前就有报道,并且部分是由于能力较低,还由于方法和研究设计的差异。

对于每一个sb-eGene,研究者在每个组织都进行了性别分层的cis-eQTL分析,降低男性的样本以匹配女性的样本大小。研究者观察到男性和女性ciseQTL效应大小间显著相关。性别分层的cis-eQTL分析发现,58% sb-eQTLs在两种性别中与等位基因效应相关,但是效应大小不同。例如,在脂肪皮下组织的rs117380715-ADRA1A在女性中的效应强于男性(图4B)。对于剩余的sb-eQTLs,只有一个cis-eQTL在女性(70, 19%)或者男性(84, 23%)中被检测到。研究者在乳腺中鉴定了一个女性特异的cis-eQTL:rs8942-C4BPB(图4B)。C4BPB编码C4b-结合蛋白的beta亚基,并且控制补体级联激活。研究者也在骨骼肌肌肉中鉴定了一个男性特异的cis-eQTL:rs2273535-AURKA。AURKA,编码丝氨酸/苏氨酸激酶家族中的一员:极光激酶A,参与有丝分裂染色体的分离和肌肉分化,是一些癌症的风险因子。这些结果说明性别偏倚对基因表达的影响存在于之前报道的一小部分cis-eQTLs,并且一些sb-eQTLs影响对人类表型非常重要的基因。

图4. 性别偏倚的eQTLs(sb-eQTLs)。(A)每个组织中发现的sb-eQTLs数量,平方根对X轴进行转换;(B)男性和女性分级的cis-eQTLs在脂肪皮下组织ADRA1A位点以及乳腺组织C4BPB位点之间的p值相关性;(C)261个乳腺sb-eQTLs的中位值分析,点坐标代表两个交互项的回归模型中G×性别(X轴)以及G×上皮细胞(y轴) 的效应大小,灰色的线表示G×性别以G×上皮细胞效应大小的置信区间,点大小代表sb-eQTL的显著性,颜色代表介质的显著性。

9 基因表达调控中的性别差异部分受细胞类型特异的eQTLs的调节

考虑到研究者eQTL模型中G×Sex相互作用条目能够捕获性别以及性别相关因子的相互作用,研究者接下来对细胞类型特异的eQTLs驱动的性别偏倚进行了描述。研究者选取了具有最多sb-eQTLs并且细胞构成性别差异最大的乳腺组织。研究者检测了261个乳腺sb-eQTLs在细胞类型相互作用的cis-eQTLs(ieQTLs)上的富集。这些ieQTLs与cis-eQTLs对应,其效应依赖于细胞类型最终的丰度变化。乳腺sb-eQTLs在脂肪细胞和上皮细胞对应的ieQTL信号上富集。加入基因型×在sb-eQTL模型中估算的上皮细胞丰度这一相互作用条目后,58%乳腺sb-eQTLs (152/261)仍然显著,而42% sb-eQTLs (109/261)中基因型×性别效应显著减弱。例如,乳腺中最强的sb-eQTL:rs2289149- LINC00920 (P = 4.83 × 10–11)在加入基因型×上皮细胞丰度相互作用条目后并不显著。

为了正式的检测细胞类型构成对sb-eQTL检测的影响,研究者进行了中介分析,利用基因型与最终上皮细胞丰度之间的相互作用作为潜在的调节因子。结果发现60个sb-eQTLs (23%)受细胞类型丰度的调节(图4C)。其他细胞类型的调节不能排除在外,特别是免疫细胞,研究者观察到乳腺sb-eGenes在免疫球蛋白可变链基因上富集。在所有的案例中eQTL在女性中的效应更大。因为免疫球蛋白基因主要在B细胞中表达,并且在乳腺性别最易区分的基因中,研究者猜想免疫球蛋白sb-eQTLs可能由女性乳腺中更丰度的这种类型细胞驱动。总之,这些结果提示在乳腺中大部分sb-eQTLs受细胞类型特异基因表达效应驱动,当性别间细胞类型不同时这种效应变得很明显,尽管研究者的分析并不能区分信号通路中真正的调节因子是检测的细胞类型还是其他相关的细胞类型。

10 性别已知的eQTL-GWAS共定位探究复杂特性的基因基础

为了探究sb-eQTLs是否能够作为一种有用的工具剖析复杂特性的分子机制,研究者在性别分层的cis-eQTLs和87个GWASs之间进行了共定位,1089个sb-eGenes在一个更加宽松的FDR范围内代表74个不同的复杂特性。研究者鉴定了74个共定位的基因特征对(图5A-C)。其中58个共定位在一种性别中——36个女性以及22个男性——对应36个特异的基因位点和27个不同的特性(图5A-C)。24/36 (67%)女性特征对以及10/22 (45%)男性特征的cis-eQTL特征对共定位。在结合性别的方法中共定位的34个位点,其共定位的信号是由单一性别的调节效应驱动的。剩余12/36 (33%)女性以及12/22 (55%)男性基因特性共定位结合性别的方法并没有鉴定到。

在特性和女性分层的cis-eQTL之间最强的共定位是CCDC88C和乳腺,以及HKDC1和出生体重(图5C、D)。相反,在特性和男性分层的cis-eQTL之间最强的共定位是DPYSL4和体脂百分比以及CLDN7和出生体重(图5C、E)。CCDC88C是Wnt信号通路的负调节因子,该机制在癌症的发展中非常重要。乳腺中CCDC88C女性ciseQTL信号与乳腺癌的风险共定位(图5D),该特性具有高度的性别偏倚发生率和表现。在乳腺癌中研究者鉴定了其他两个女性驱动的(PP4F > PP4M)且共定位的sb-eGenes—NTN4和CRLF3。

研究者也发现相对于男性分层的cis-eQTLs,血液和免疫的特性更倾向于与女性分层共定位,这包括炎性肠病,该疾病随着年龄的增加在女性中患病率更高,且免疫细胞的丰度也表现出性别差异。总之,这些结果提示性别偏倚的基因表达调控可能是具有显著性别差异疾病的病因。

此外,研究者鉴定了eQTLs与性别特异特征GWAS以及性别特异条件来源信号之间的共定位,例如女性孕期以及男性秃顶模式。在乳腺中C9orf66男性分层的cis-eQTL信号与男性秃顶共定位,在肝脏中HKDC1女性特征cis-eQTL信号与出生体重共定位,受母系因素的严重影响(图5D)。在肝脏中sb-eQTL的这一位点在独立的数据库中重现。HKDC1编码己糖激酶家族中的一员并且参与葡萄糖代谢。与rs35696875完美或者高度不均衡连接的多个突变体导致HKDC1的表达降低,与妊娠期糖尿病的风险以及孕期血糖特征相关。在本研究中证实在肝脏中HKDC1女性eQTL信号与孕期母系血浆中血糖水平共定位。近期发现在肝细胞中跨越多个增强子的调节突变体对HKDC1的表达具有等位基因的效应。GTEx肝脏样本中肝细胞丰度的估计在性别上并无差异,并且rs35696875-HKDC1 sb-eQTL并没有表现出肝细胞ieQTL的迹象。因此,不像乳腺中的许多sb-eQTLs,肝脏中HKDC1 sb-eQTL并不是由性别差异细胞类型的丰度驱动的。HKDC1 sb-eQTL可替换的等位基因与HKDC1的低表达、母系血糖水平升高以及出生体重的升高相关。这些结果提示HKDC1女性ciseQTL能够影响孕期女性葡萄糖代谢,体现在后代出生体重上。然而需要进一步研究证实因果关系。

此外,在骨骼肌肉中DPYSL4男性分层cis-eQTL信号与体脂百分比相关的基因信号共定位(图5E)。DPYSL4与肥胖和癌症的病理生理学相关:p53诱导的DPYSL4与线粒体超级复合体相关,并且在脂肪细胞和癌细胞中调节能量代谢。低表达的DPYSL4与乳腺患者的低存活相关。重要的是,尽管与男性分层的cis-eQTL信号检测到共定位,共定位的可能性低似乎是由于在女性中存在的cis-eQTL,在男性中缺失。这些结果提示在复杂特性的基因关联以及分子表型中描述性别差异对于剖析等位基因的异质性是非常有用的。

五个共定位的sb-eGenes (CLDN7, CCDC125, FAM53B, PLEC,以及SOWAHC),对应细胞类型相互作用cis-eQTL信号,同样与之前报道的GWAS信号共定位。例如在乳腺中男性偏倚的cis-eQTL rs34958987-CLDN7被鉴定为乳腺上皮细胞ieQTL。sbeQTL和细胞类型ieQTL信号与出生体重GWAS信号共定位。这提示这些基因特性关联中的性别差异可能来源于性别差异的细胞类型丰度中。

最后,为了探究性别偏倚的eQTL信号反映在性别偏倚GWAS效应中,研究者从性别偏倚GWAS数据中获取了36/58个共定位的基因特征对。研究者鉴定了2/36个GWAS效应大小的性别差异。这两个信号对应RNASET2和CELSR2基因,分别与女性甲状腺功能亢进和男性心脏病发作更相关。然而,在现有GWAS样本大小上,研究者观察到在eQTL水平上性别偏倚的效应并不能转化为GWAS水平上性别偏倚的效应,需要数百万个GWAS样本来解决这一问题。

总之,研究者共定位的结果证实性别偏倚的细胞类型丰度所在的位点调节基因型-表型之间的关联,并且性别在这个位点上对于探究这一关联的分子机制可能发挥直接作用,例如HKDC1位点。对于未来研究,用共定位的方法揭示内部或者环境是一种极具前景的发现基因特性关联及其潜在起源的方法。

图5. sb-eQTLs与GWAS特征共定位。(A)74个共定位的基因特征对的后验概率(PP4),GWAS中显示与女性分级或者男性分级的cis-eQTL共定位(PP4 > 0.5),每个组织中共定位位点数目在括号中显示;(B)男性和女性cis-eQTLs共定位位点的数量;(C)GWAS-eQTL共定位基因依据图A中的eQTL来源组织进行颜色标记,共定位信号与对应的GWAS特征对应,比较男性和女性cis-eQTL信号通共定位PP4;(D)CCDC88C(左侧)和HKDC1(右侧)位点基因型-表型相关的P值。对于CCDC88C位点,面板说明了乳腺癌的GWAS信号(上部)、乳腺组织中女性(中间)以及男性(底部)的cis-eQTL信号。对于HKDC1位点,面板说明了出生体重的GWAS信号(上部)以及肝脏中男性(底部)、女性(中间)的HKDC1 cis-eQTL信号;(E)CLDN7(左侧)和DPYSL4(右侧)位点基因型-表型相关的p值。对于CLDN7位点,面板说明了出生体重的GWAS信号(上部)、乳腺组织中女性(中间)以及男性(底部)的CLDN7 cis-eQTL信号。对于DPYSL4位点,面板说明了体脂的GWAS信号(上部)以及肌肉平滑肌组织中女性(中间)以及男性(底部)的DPYSL4 cis-eQTL信号。

结论

通过将带有基因功能和转录因子结合注释的GTEx数据中性别意识分析进行整合,研究者对人类转录组和eQTLs中导致性别差异的组织特异性驱动因子和机制进行了描述。结果发现多个性别差异的遗传效应对基因表达的影响,这些基因与复杂性状的遗传关联存在共定位,由此促进GWAS信号的机制阐释。由于病因组织的一些表型还不清楚,对多个GTEx组织收集分析可作为探究性别偏差性状的有力资源。该项工作对人类转录组及其调节机制的性别差异进行了广泛的描述。

这些效应虽小,但是大部分是组织特异性的。性别-差异表达的基因并不主要由组织特异性的基因表达驱动,它参与了一系列不同的生物学功能,例如药物和激素应答、胚胎发育和组织形态发生、受精、有性生殖和精子形成、脂肪代谢、癌症以及免疫应答。然而X相关基因在女性中表达更高提示有一些基因在X染色体失活中逃脱,常染色体的性别偏倚表达提示激素相关转录因子的调节、其他转录因子的作用以及表观标记物特别是H3K27me3性别差异分布。

在基因表达调控中性别的差异并不常见,并且具有高度的组织特异性。研究者在单性别中鉴定了58个基因表达调控驱动的基因-性状关联,包含的位点有调节基因型-表型关联的性别差异的细胞类型丰度,以及在关联潜在的分子机制中发挥直接作用的性别位点。例如研究者在肝脏中鉴定出一个女性特异的eQTL—己糖激酶HKDC1,能够影响孕期妇女的葡萄糖代谢,随后反应在后代出生时的体重上。


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

END

(0)

相关推荐