科研 | Nat Commun:mRNA异构体的鉴定揭示神经细胞表面分子多样性及在视网膜发育和疾病中的作用

编译:思越,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。

导读

编码细胞表面蛋白的基因控制着神经系统的发育,并与神经疾病的进展有关。选择性剪接、内含子和及转录起始和终止位点等机制使 mRNA 序列多样化,产生蛋白质编码能力不同的异构体,这些异构体在定位、翻译及降解上具有明显的差异。由于现有基因注释数据库对异构体注释较有限,以及RNA-seq读长的限制,这些mRNA异构体尚未被全面的鉴定,在中枢神经系统中也是如此。在本文中,作者将一种新的定义异构体的方法,以识别在视网膜和大脑中未被注释的异构体,并发现了与视网膜变性相关的Crb1基因的新异构体,以及该异构体的缺失对视网膜光感受器的影响。

论文ID

原名:Comprehensive identification of mRNA isoforms reveals the diversity of neural cell-surface molecules with roles in retinal development and disease
译名:mRNA异构体的鉴定揭示神经细胞表面分子多样性及在视网膜发育和疾病中的作用
期刊:Nat Commun
IF:12.121
发表时间:2020年7月3日
通讯作者:Jeremy N. Kay
通讯作者单位:杜克大学医学院
DOI号:10.1038/s41467-020-17009-7

实验设计

作者筛选出具有未注释特征的大片段候选基因,使用PacBio长读长测序技术与短读长测序结合的改进方法lrCaptureSeq进行测序,以提升测序深度。使用软件PacBio Iso-Seq和开发R包IsoPops确定异构体的数量和reads的组成。并设计生物信息学软件对异构体进行分类和比较,并将此方法用于Crb1基因上,以确定Crb1新的异构体的表达模式。

结果

1 使用RNA捕获长测序(lrCaptureSeq)技术鉴定异构体并分类
作者首先使用小鼠视网膜和大脑的rna seq数据,筛选这些基因在CNS发育过程中表达的相关性,并通过RNA-seq reads检测是否存在未注释的外显子或剪接位点(图1A),发现约15%的基因(60/402)表现出未注释特征,并选为候选基因。作者在 CaptureSeq的基础上,开发了捕获长测序( lrCaptureSeq)技术以提高长序列的测序深度(图1b和c)。作者从候选基因中过滤出30个编码4-8kb长度的基因,这些基因跨越了发育的不同阶段以及中枢神经系统的不同区域,包括涉及轴突引导,突触形成和神经元-神经胶质相互作用的基因、以及与遗传性光感受器退化有关的基因Crb1进行lrCaptureSeq,这些基因的绝大多数reads都在目标长度范围内(图1c),从而保证对较长cDNA测序的深度。通过对30个基因在小鼠视网膜和大脑的不同时间点进行lrCaptureSeq,最终识别出30个基因的4116个异构体,异构体的数量比目前公共数据库中的异构体数目多了一个数量级(图2a,b),其中只有9%的亚型存在于已知数据库中。
为了确保这些异构体是真实性,作者使用独立数据集来验证其转录起始位点和剪接点。CAGE-seq(cap analysis of gene expression)可获得mRNA的启动子信息和5’UTR信息,通过对成年小鼠视网膜的CAGE分析,鉴定出97.7%的转录起始位点,并选择性地映射到异构体的5'端;通过对视网膜和大脑的RNA-seq数分析,鉴定出98.9%外显子剪接点在相应的位置上,进而证明了lrCaptureSeq异构体分类的准确性。
图1识别异构体多样性特征的细胞表面受体流程
2 有效异构体在整体基因表达中的作用
作者基于异构体在基因中必须有差异地表达以及其序列差异足以保证编码功能差异的角度,去评价异构体在影响基因表达中的作用。作者评估了每个基因的多个异构体在基因中的表达分布(图2c,e),部分基因如Egflam和Crb1的表达只有少量由异构体表达,而其他基因的表达在异构体中分布地较为均匀(图2c,e)。基于香农指数对mRNA表达的异构体多样性进行排序,Nrnx3具有最高的得分,latrophilin和蛋白酪氨酸磷酸酶受体(PTPR)家族的得分接近(图2d)。综上,大部分的异构体在基因中都明显的表达。
图2 lrCaptureSeq显示mRNA异构体多样性
3 有效异构体的功能差异
作者接着研究了这些异构体在序列和外显子数目上的差异,通过无监督聚类,基于这些异构体的序列相似性进行分组(图2f,g),包括5’非编码区的长度,3’非编码区的长度及外显子的可变剪接,发现每个基因聚到同一类的异构体具有类似的可变剪接模式。通过分析开放阅读框,发现异构体的数量和预测的蛋白质数量之间有很强的相关性(图3a),ORF的多样性因基因而异,但总体分布与mRNA相似(图3b-d),并发现ORF多样性最大的基因倾向编码一种特定类型的细胞表面蛋白,且香农指数最高的基因都编码突触间粘附分子(图3c),因此,这些异构体可能产生了影响突触连接形成或稳定性的蛋白质变体。
作者接着从蛋白水平探究mRNA多样性对蛋白质序列的影响。Megf11基因编码一种跨膜表皮生长因子(EGF repeats)重复蛋白,该蛋白与视网膜发育过程中的细胞识别有关。在该基因的26个编码蛋白质的外显子中,21个发生可变剪接。通过对该基因的异构体要就发现,大多数组成胞外结构域的 EGF 重复序列是由单个外显子编码的,可变剪接使得这些重复序列模块化(图4a-d)。最容易发生改变的EGF重复序列区域由外显子14-16b编码(图4b) ,在胞内 ITAM或ITIM motif的作用下,外显子也表现出模块化的特征。通过BaseScopeTM 原位杂交证实了这些可变剪接在体内视网膜神经元中的表达(图4e),且在表达Megf11基因的单个细胞中也检测到了这些剪接体的表达,说明异构体的多样性有助于神经元细胞表面蛋白的种类多样化。
4 异构体在体内编码细胞表面蛋白
为了确定lrCaptureSeq鉴定的异构体是否转化为蛋白质,作者使用质谱法进行了视网膜细胞表面蛋白质组的研究(图3e,f)。为了了解这些样品是否含有 lrCaptureSeq 鉴定的蛋白质异构体,作者在 lrCaptureSeq 目录中生成了一个胰蛋白酶多肽产物数据库。以该数据库为参照,质谱实验共鉴定出28个基因的686个多肽,其中35种多肽只出现在lrCaptureSeq参考数据库而不在 UniProt中(图3g)。这些发现有力地表明,至少有一部分lrCaptureSeq预测的蛋白质在活体视网膜细胞表面表达。
图3  转录本多样性有助于丰富蛋白质多样性
图4  模块化可变剪接驱动Megf11异构体多样性
5 Crb1亚型的鉴定
为了探究新发现的异构体是对基因功能的影响,作者选取视网膜疾病基因Crb1进行研究。Crb1基因属于进化上保守的Crumbs基因家族,编码介导细胞基底上皮极性的细胞表面蛋白,该基因的能缺失突变会导致一系列视网膜退行性疾病。作者在建立的数据库中发现了15种Crb1的异构体(图5a,b),部分具有组织特异性并受到发育调控,并且在成熟视网膜中Crb1主要表达一种之前未被注释的异构体,具有独特的5’和3’外显子和启动子(图5a,图6a,c)。作者将这种异构体命名为Crb1-B,以区别于之前的Crb1-A异构体。Crb1-B也是人类视网膜中含量最丰富的异构体,由人视网膜cDNA产生的lrCaptureSeq数据集表明(图5d和图6b)。异构体Crb1-C在人的视网膜中也有中等水平的表达,但仍然低于Crb1-B的表达(图5d和6b),且ATAC-seq在人类和小鼠视网膜中发现了一个假定的B异构体启动子(图5c-e)。综上,视网膜疾病基因Crb1的主要异构体被人们所忽视,:在脊椎动物中,Crb1-B 是视网膜中主要的 Crb1亚型。
图5  视网膜特异性Crb1异构体的鉴定
图6  Crb1-B是视网膜中最丰富的的Crb1异构体
6 Crb1亚型在不同类型的视网膜细胞中表达
据预测,Crb1-B编码的跨膜蛋白与Crb1-A具有显著的胞外域重叠,但在胞内域却完全不同(图7a,b)。因此,因此接着研究这种蛋白质是否被表达以及蛋白质的定位。针对胞内结构域的抗体进行WB表明,Crb1-B蛋白在体内存在,并且在缺乏Crb1-B启动子和5'外显子的小鼠中细胞内结构域表达缺失(图7C)。此外,Crb1-B可在膜组织中检测到,但在视网膜裂解物的可溶性组织中未检测(图7d)。这些数据表明,Crb1亚型主要定位于细胞表面。为了确定Crb1-A和Crb1-B的表达模式,作者开发了一种评估单细胞测序数据集中lrCaptureSeq异构体的表达评价策略。将这一策略应用于小鼠视网膜发育过程中的scRNA-seq数据,发现每种异构体具有不同的表达模式。Crb1-A主要由Müller胶质细胞表达,Crb1-B主要由锥体细胞和杆状细胞表达(图8A,b)。此外,这些细胞特异性表达模式通过两种独立的方法进行验证: 首先,杆状和锥状细胞的ATAC-seq数据表明感光细胞选择性地使用 Crb1-B 启动子(图5c);BaseScope染色证明两种异构体的异位表达,Crb1-A定位于Müller细胞,Crb1-B定位于感光细胞(图8c)。为了验证Crb1-B 蛋白的亚细胞定位,作者使用结合视网膜冷冻切片与WB结合的技术(图8d),证实了Crb1-B在感光细胞层内侧和外侧的表达,而Crb1-A在Müller 细胞的尖部表达。
图7  Crb1-B蛋白特征
图8  Crb1-B在感光细胞中表达
7 Crb1-B是外界膜完整性所必需的
接着作者研究异构体Crb1-B的功能。感光细胞和Müller细胞是表达Crb1亚型的两种细胞类型,参与形成外界膜的细胞连接(图9b,c)。已有研究表明Crb1疾病的退行性病理可能是由于这些细胞连接的破坏引起。作者构建了Crb1delB和Crb1null突变小鼠,分别缺失Crb1-B异构体和缺失Crb1所有异构体,通过电镜观察外界膜的完整性,发现Crb1null突变体的外层视网膜的结构破坏(图9b-e),感光细胞与 Müller细胞的紧密连接发生了中断(图9f);在缺乏Crb1-B但保留Crb1-A的Crb1delB/delB小鼠中,外界膜的中断仍可能发生。这些结果表明,外界膜的连接完整性需要两种Crb1异构体的存在。
图9  外界膜完整性需要Crb1的参与
8 缺乏Crb1异构体的小鼠发生视网膜变性
最后,作者探究了新发现的Crb1异构体是否可用于改进神经退行性疾病动物模型的构建。作者构建了Crb1delB和Crb1null突变小鼠,对光感受器的计数(P100)显示,Crb1-A和Crb1-B两种亚型都是光感受器生存所必需的,单独去除两种异构体的任何一种对于视网膜退化的改进效果很小(图10a,d);通过去除所有的异构体的Crb1null突变小鼠引起明显的光感受器退化(图10a-d),说明显著的退化需要异构体Crb1-A和Crb1-B的共同参与。总之,Crb1的多个异构体共同促进了光感受器的状态,在lrCaptureSeq技术的指导下,通过合理设计突变等位基因,可以建立更为高效的人类疾病模型。
图10  Crb1异构体的基因消融引起视网膜的退化

平论

本文通过lrCaptureSeq技术揭示中枢神经系统转录组丰富的多样性,通过结合PacBio长读长测序技术与短读长测序结合方法,以提升测序深度。本文发现了大量未被已知数据库注释的编码细胞表面蛋白质的异构体,并发现Crb1-B的异构体,具有与典型 Crb1亚型不同的表达模式和功能,并证明CRB1是外界膜完整性和光感受器存活所必需的。总之,建立全长异构体分类具有重要的价值,缺少这类信息可能会忽视基因的关键功能,引起对疾病表型的错误推断。

更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐