新一代的AAV载体---莫以衣壳论英雄
注:本文的内容源于Dirk Grimm的一篇review文章Next-generation AAV vectors—do not judge a virus (only) by its cover[1]。文章虽然已经发表了一段时间,但是作者总结的内容仍然是值得一读的。 小编于是自己就做了详细的文献笔记然后再把文章里的内容跟大家分享一下。
提要:
作为被科学家们寄予厚望的明星载体,AAV已经被应用到了许多的基因治疗疗法当中。例如基于AAV1的Glybera,基于AAV2的Luxturna以及基于AAV9的Zolgensma,都为大家展示了AAV的强大能力。基于AAV的基因疗法,还有巨大的进步空间,比如说可以通过提高目的基因表达能力,增强目的基因表达特异性这样的方法,去降低治疗时所需注射的病毒量进而增强治疗的安全性。在这篇综述当中,作者归纳了几类很有前景的AAV开发方向,其中包括:
iii. 考察AAV DNA的结构对基因组稳定性、完整性和功能性上的影响。
前言:
在前言里,作者先用几个例子来讲述了近些年来,科研人员在衣壳蛋白改造方面所取得的成果。比如说①AAV-PHP.B和基于AAV9的peptide display variants,他们都可以高效地在C57BL/6小鼠中穿越血脑屏障;②通过ancestral reconstruction获得的Anc80L65,它可以在灵长类动物的肝脏等组织中非常有效地进行基因递送;③嵌合型的AV-DJ,它由8个不同的野生型AAV进行DNA shuffling后得到,它不单在多种类型的细胞中都有效,并且还比母本之一的AAV2更具有免疫逃避性。(小编注:著名的AAV-PHP.B是利用了Cre recombination–based AAV targeted evolution-CREATE的方法[2],所得到一个优秀AAV衣壳,具体来说作者做了一个AAV variants 的library。在library中作者将7个随机的氨基酸序列 (7-mer) 插入到AAV9 capsid VP1 588与599之间,并将其与Helper共同注射到Cre transgenic小鼠中。由于AAV的polyA位于lox71和lox66 位点之间,因此被成功递送到细胞内的AAV的 ployA序列会在Cre酶的作用下,完成序列反转。作者针对反转后的序列设计了特异性引物,于是只有被递送到细胞内后反转了的AAV序列才可以被扩增出来,这样就可以与注射后AAV高背景完全区分开。经过两轮筛选,作者得到了AAV-PHP.B,它在CNS系统中,效率比野生型高出了40倍。图1)
图1. CREATE筛选过程的概述
接下来,作者又用双链AAV或自我互补AAV来举例,描述了科学家在AAV基因组结构上的改造工作。作者提到在ssDNA AAV转导细胞时(图2),AAV的两个ITR会形成发卡结构,并可以作为引物,启动第二条链的合成。这个步骤被认作是AAV感染的限速步骤之一。而scDNA则是通过对ITR的改造,规避了第二链合成这一步骤,增加了在体内外AAV装载的目的基因表达的强度、缩短开始表达时间(在体外,scAAV 载体的转导效率是传统 rAAV 的 5 到 140 倍)。但这一方法也将AAV所能承载的目标基因容量砍到了野生型AAV一半的水平。(作者接下来也对目前扩增AAV容量的工作进行了梳理,小编在之前的文章中https://mp.weixin.qq.com/s/MPkUx88nib5zUy29Ga0npw有过针对这一内容的详尽描述,所以就不在本文赘述了)
图2. 传统单链AAV (ssAAV) 和自我互补AAV(scAAV)载体的DNA rescue与 transduction
一. 给AAV装配上新的合成启动子/增强子
启动子是启动和控制相关基因转录的顺式作用元件,它是AAV 表达载体上的一个关键元件。这些原件由位于受调控基因上游约 100–1000 bp的core/proximal promoter组成,并携带有转录因子 (TF) 的结合位点 (BS) 簇。它们可以在转录起始位点上激活或抑制由RNA 聚合酶 II所介导的转录起始。目前外源性(通常来自病毒并具有组成型活性)或内源性(通常具有组织/细胞特异性)启动子已经被普遍用于 AAV 基因治疗载体。尤其是强的组成型启动子,例如Spleen focus forming virus (SFFV)、人多肽链延长因子 (EF1α)、磷酸甘油酸激酶 (PGK) 、泛素 C (UbiC)、巨细胞病毒 (CMV) 或鸡 β-肌动蛋白 (CBA) 等启动子,它们可以在大多数类型的细胞中实现稳定、快速和长期基因表达,因此最先被应用在临床试验中。并且在在已经上市的产品中, CMV 启动子就驱动了 Glybera 中的脂蛋白脂肪酶基因的表达,而CBA 启动子驱动了Zolgensma 中的SMN基因的表达。
然而,这些强的组成型外源启动子也存在一些缺点:首先,相比于组织特异性启动子,强组成型启动子在宿主体内更容易被失活,例如强启动子区域会被宿主甲基化,并引起剧烈的转录沉默;其次,强组成型启动子的应用也会受限于由其高强度的表达能力所引起的一些毒性反应,这其中又包括: ①目标基因的过表达引起的毒性,②目标基因在非靶标组织中的过表达引起的毒性以及③外源基因表达所引起的免疫反应。而内源性启动子往往是来源于仅在某些细胞类型中表达的基因,尽管这些启动子的表达水平通常低于组成型启动子,但它们为基因治疗提供了组织特异性表达的可能性。例如血友病 B 的前两项临床试验就利用了来自肝脏的特异性启动子,即 ApoE/hAAT启动子和 LP1启动子。
为了规避组织特异性启动子的固有弱点,许多不同的启动子优化策略已经被设计出来。比如说在组织特异性核心启动子的上游添加增强子元件,这样既可以提高目标基因的表达水平,又保持其在组织上的特异性。譬如说Herweijer评估了白蛋白启动子与不同增强子以及不同非翻译区的组合,并筛选出了一种可用于肝脏特异性表达最佳设计(将白蛋白启动子与甲胎蛋白 MERII 增强子串联使用)。该设计在肝脏中驱动分泌型碱性磷酸酶基因表达时,不仅特异性强,而且能和CMV 启动子一样高效。
图3. 典型 AAV 表达载体的组成部分
除了增强子,其他顺式调节元件也可以添加到表达盒中以实现精细调节并提高转基因表达效率的目的。例如,woodchuck hepatitis virus post-transcriptional regulatory element (WPRE) 最近被证明可以增强小鼠肝脏、大脑和肌肉以及小鼠和人类视网膜中的AAV 转导;将内含子掺入启动子和转基因编码序列之间,也可以改善基因表达(一个值得一提的内含子是minute virus of mice (MVM) 内含子,据报道它可以将小鼠肝脏中的 FIX 表达提高约 80 倍)。
虽然将一个或多个顺式调控元件与启动子串联使用可以明显提高目标基因的表达量,但有个问题要注意的是:AAV 仅有4.7 kb 的包装容量。因此,许多研究组利用对启动子非必要序列进行删除的方法,开发出了序列更短的启动子,并同时保留了该启动子的高效性与组织特异性。一个具有代表性的例子是在CNS星形胶质细胞中起作用的的 2.2 kb 人神经胶质纤维酸性蛋白 (GFAP) 启动子及其681 bp缩短版本的 gfaABC1D启动子。后者表现出与全长 GFAP 启动子相同的表达模式,甚至比全长 GFAP 启动子的活性高了 2 倍(图4)。此外,一些肌肉特异性启动子也被成功删减,例如肌球蛋白轻链-2v (MLC)和肌肉肌酸激酶 (MCK)启动子。由于MCK 启动子6.5 kb的大尺寸使其与难以被装载到AAV 载体上,因此Wang等人将MCK 增强子串联到高度截短的微型 MCK 核心启动子上游,从而构建了一个较短的版本。由此产生的启动子 [dMCK (509 bp), tMCK (720 bp)] 显示出比 CMV 启动子更高的肌肉特异性和比MCK启动子更高的活性。
图4. 基于人类GFAP基因构建的星形胶质细胞靶向启动子异构体的示意图
AAV 启动子优化中的主要挑战是确定启动子、增强子和非翻译区域中的哪些元件决定了基因表达的强度和/或特异性。幸运的是,一些高通量方法,已经被开发出来并被用于去鉴定、识别哺乳动物启动子、增强子活性。例如,嵌合的肝脏特异性启动子1 (LP1)就结合了人载脂蛋白 E/CI的肝脏表达控制区、hAAT 启动子和 MVM 内含子。类似地,SPc5-12 启动子由肌肉特异性控制元件(MEF-1/-2、SRE、TEF-1的BS)串联组成,并且在肌肉表达上优于CMV启动子。CK8启动子的构建则基于MCK基因的增强子和启动子调节区域的筛选与鉴定。
此外conserved regulatory motifs的重要性也需要被重视。一些新的计算方法可以识别出与强组织特异性表达相关的进化上保守的转录因子结合位点 (TFBS),以及由TFBS组成的cis-regulatory modules (CRMs),从而可以设计出适用于特定细胞类型的特异性启动子。例如CRÈME、LogicMotif、POCO、DDM-MDS等工具可以对基因组中的假定TFBS进行识别;Chuah 和 Vanden Driessch等人则着眼于肝细胞、心脏和骨骼肌的 CRM的挖掘与应用。具体来说,他们先根据microarray expression data确定了高表达的组织特异性基因,然后提取了相应的启动子序列。接下来,他们使用 DDM-MDS 方法确定了 CRM 及其相应的 TFBS。最后,再对计算的结果进行筛选。基于这个方法,Chuah 和 Vanden Driessche 等人成功地识别了骨骼肌特异性 CRM(Sk-CRM4,435 bp),并将它与肌肉特异性结蛋白启动子结合,最终将荧光素酶表达提高了 400 倍,更重要的是,转录活性的增强对肌肉组织具有特异性(小编注:这个组的相关文章都值得一看,它们利用整合特定组织高表达基因,识别CRM,实验筛选的方法,合成了多个高强度的组织特异性启动子[4],图5。另外如下几个数据库,小编也向大家推荐下:Cister:Cis-element Cluster Finder;Match 1.0; TRANSFAC matrix; Alibaba 2.1 ;ClusterBuster)。
图5.鉴定肌肉特异性cis-regulatory modules (CRMs) 的流程图
二. 通过 microRNA 或光调节 AAV 转基因表达
作为使用诱导型或组织特异性启动子的替代或补充策略,AAV 基因表达的组织特异性调控,也可以通过利用 RNAi 机制和miRNA的组织特异性来达到。miRNA是基因表达的转录后调节因子,它们通过破坏与miRNA序列互补的 mRNA 靶标而发挥作用,通常一种 miRNA 可以与数百个不同的靶标相结合。在过去几年中,科学家已经鉴定出许多可以在特定组织中专门表达的 miRNA,例如表达量高且仅在肝脏中有表达的 miR-122或 仅在肌肉中才会被检测到的miR-1。
switch-OFF system 与FINE system
switch-OFF system将组织特异性 miRNA 的完全互补结合位点装载到目的基因的 3'UTR 上,在特定组织内表达的miRNA与目的基因mRNA结合,使其降解,最终在靶标组织中降低目的基因表达量。Brown等人首先将组织/细胞特异性的 miRNA应用到调控慢病毒载体介导的基因表达上,它们向gfp的 3'UTR 中插入了 miR-142-3p的四个结合位点(miRNA-BS),从而特异性降低目的基因在脾细胞而非肝细胞中的表达。另外科学家构建的,含有miR-122 和 miR-199a 结合位点的 AAV,可以特异性介导自杀基因在肝癌细胞 (HCC) 中的表达。因为与在健康肝细胞中相比,这两种 miRNA在肝癌细胞中的表达量会明显降低。另外,在switch-OFF system的一个新版本中,科学家通过使用imperfect 或者bulged 的结合位点,来模拟内源性 mRNA 不稳定机制。并通过高通量测序,科学家研究了数千种与内源性 miRNA 具有不同亲和性的合成 miRNA-BS,从而产生了一个基于 miRNA 的基因表达微调库,并可以用它精确调节目的基因的表达水平。 此外,由于miRNA结合位点序列较短,因此可以将多个 miRNA结合位点序列合并到一个载体中,以期同时对多个组织进行detarget。
图5. switch-OFF system 与FINE system
switch-ON system与 switch- (OFF/ON) system
然而,并非所有组织或细胞类型都适合应用这种switch-OFF的调控策略。为了避免这种情况,科学家发明了一种switch-ON system。在这个系统中,miRNA 被用于下调可与目的基因操纵子序列结合的细菌阻遏蛋白的表达,从而选择性地激活目的基因在该 miRNA 的靶组织中表达。因此,该系统可以利用单个内源性 miRNA 间接驱动目的基因在靶标组织中的表达。例如Pichard等人将4个完全互补的miR-122、miR-142-3p 或 miR-133的结合位点装配到TetR 编码区下游。他们通过利用TetR 调节了绿色荧光蛋白 (GFP) 的表达水平,并验证了该系统可以在肝脏、巨噬细胞或肌肉来源的细胞中行使功能。(小编注:在本段的最后一部分,作者也举了个几个通过光触发,诱导AAV cargo基因在细胞中的表达的例子。就目前来说,已经有多个光控的蛋白表达系统被开发出来,但是这些系统往往①结构复杂,难以被装配到一个AAV上;②目的基因的表达很难被严谨地控制;③并且光控系统中会有调节蛋白需要被持续性地表达,才能达到阻遏目标蛋白表达的目的。因此,想将光控系统整合到AAV上还有很长的距离要走。)
三. 识别和消除AAV基因组中不利的结构元素
结语
参考文献:
[1] Domenger C, Grimm D. Next-generation AAV vectors—do not judge a virus (only) by its cover[J]. Human molecular genetics, 2019, 28(R1): R3-R14.
[2] Deverman B E, Pravdo P L, Simpson B P, et al. Cre-dependent selection yields AAV variants for widespread gene transfer to the adult brain[J]. Nature biotechnology, 2016, 34(2): 204-209.
[3] McCarty D M, Monahan P E, Samulski R J. Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis[J]. Gene therapy, 2001, 8(16): 1248-1254.