Cell:清华大学张强锋等解析细胞内新冠病毒RNA结构,利用人工智能发现靶向宿主蛋白的重定位药物​

新型冠状病毒(SARS-CoV-2)是造成全世界新冠肺炎大流行的罪魁祸首。截止目前,全世界范围内已经有超过1亿人感染新冠病毒,超过两百万人死亡。新冠病毒是一种单股正链RNA病毒,病毒RNA基因组本身既编码了遗传信息,也是病毒基因组复制的调控中心。理解新冠RNA基因组的结构以及与之相互作用的宿主蛋白,可以帮助我们更好地开发治疗新冠的药物。

近日,清华大学生命科学学院张强锋课题组与协和医学院王健伟课题组以及清华大学医学院丁强课题组合作,在Cell 杂志在线发表了题为:In vivo structural characterization of the SARS-CoV-2 RNA genome identifies host proteins vulnerable to repurposed drugs 的研究论文【1】。

该研究利用icSHAPE技术,解析了感染细胞内新型冠状病毒RNA基因组的二级结构,以及其他6种冠状病毒属RNA非编码区的二级结构,发现并验证了新冠病毒多个重要的RNA结构元件。
同时,利用课题组最新开发的人工智能算法PrismNet【2】预测并验证了多个与病毒RNA相互作用的宿主蛋白,并找到了潜在抗新冠的重定位药物(repurposed drugs)。
新冠病毒RNA结构解析,保守RNA结构鉴定,互作宿主蛋白发现以及抗病毒药物筛选
无论是新冠肺炎(COVID-19)、非典(SARS)、还是中东呼吸综合征(MERS),其病原体都是单链RNA病毒。病毒RNA会折叠成复杂的RNA结构,在病毒的生命过程调控中起重要作用。很多研究已经发现多种病毒的非编码区RNA结构可以调控病毒的翻译、复制以及稳定性。
张强锋课题组一直致力于从RNA结构的角度研究病毒的生活周期并开发新的抗病毒策略。2018年,该课题组利用icSHAPE技术与PARIS技术解析了寨卡病毒亚洲株系(流行株,致病性较高)与非洲株系(非流行株,致病性较低)的RNA结构,发现并验证了一个在亚洲株系中特异存在的5'非编码区域与E蛋白编码区域的长距离相互作用。破坏该相互作用会抑制病毒的扩增,为解释不同株系间的致病性差异以及病毒的适应性进化提供了新的认识(Li et al., 2018)。
新冠肺炎疫情爆发之后,张强锋课题组与协和医学院王建伟课题组以及清华大学医学院丁强课题组迅速行动,在之前研究基础上,不仅解析了新冠及其相关病毒的RNA结构,还利用新开发的深度学习模型PrismNet,尝试从新的角度寻找有效的抗病毒药物。
作者首先利用icSHAPE技术解析了侵染细胞内以及体外重新折叠的新冠病毒RNA全基因组二级结构。利用共进化信息以及能量最低原则,同时整合实验获得的icSHAPE数值,作者构建了全长3万碱基的新冠病毒RNA结构模型。与此同时,作者合成了已知的6种其他冠状病毒的非编码区及其附近区域的序列。通过体外转录,作者解析了其他冠状病毒的体外RNA结构。
新冠病毒RNA结构研究方案示意图
通过结构模型,作者找到了37个保守的RNA结构元件,并通过反义多聚核酸(ASO)干扰RNA结构,以及引入突变破坏RNA结构,并且引入互补突变恢复RNA结构等实验手段验证了相关RNA结构元件对病毒复制的重要作用。通过比较不同种类冠状病毒RNA结构,作者发现,虽然不同冠状病毒间具有较低的序列保守性,但是却有较高的结构保守性以及非常相似的结构模式。通过对病毒不同蛋白对应的RNA结构与翻译速率以及病毒亚基因组表达量的关联分析,作者发现RNA结构会影响病毒亚基因组的表达量以及蛋白的表达量。
在张强锋课题组另外一个工作中,他们通过整合细胞内RNA结构信息,利用深度学习算法构建了预测RNA结合蛋白-RNA相互作用的PrismNet模型【2】
在这项工作中,作者利用细胞内新冠病毒RNA结构,通过PrismNet模型预测了42个与新冠RNA相互作用的宿主蛋白。针对宿主蛋白,作者找到了多个可以抗新冠的重定位药物。利用多种新冠病毒细胞培养模型,作者在不同细胞内验证了多种重定位药物能有效抑制新冠病毒复制,为抗新冠药物的开发提供了一个新的思路。
据悉,清华大学张强锋研究员、协和医学院王健伟教授以及清华大学丁强研究员为论文共同通讯作者;清华大学博士后孙磊、清华大学博士生李盼鞠晓辉、协和医学院博士后饶健以及清华大学博士生黄文泽为论文共同第一作者;协和医学院任丽丽研究员和清华大学博士生徐魁为本研究做出了重要贡献。
论文链接:
1、https://doi.org/10.1016/j.cell.2021.02.008
2、https://doi.org/10.1038/s41422-41021-00476-y
(0)

相关推荐