科研 | 浙江大学王佳堃: 基于宏转录组学揭示湖羊瘤胃中新型纤维素酶
本文由流年梦编译,十九、江舜尧编辑。
原创微文,欢迎转发转载。
纤维素是植物生物质的主要成分,是一种由β-1,4糖苷键链接D-葡萄糖单体而成的线性多糖。面对日益加剧的能源危机,数量丰富且可再生的纤维素生物质通过生物转化形成生物燃料,可作为一种替代化石能源的可用资源。其中纤维素酶在生物质转化为生物燃料以及其他有价值产品中扮演着重要的角色。本研究通过宏转录组和体外异源表达结合的方式,揭示了湖羊瘤胃微生物中存在大量的新型纤维素酶。新发现的纤维素酶具有较高的环境耐受性,具有较高的工业应用价值。
论文ID
原名:Metatranscriptomics of the Hu sheep rumen microbiome reveals novel cellulases
译名:基于宏转录组学揭示湖羊瘤胃中新型纤维素酶
期刊:Biotechnology for biofuels
IF:5.452
发表时间:2019.6
通信作者:王佳堃
通信作者单位:浙江大学 动物科学学院
实验设计
样本选择1.5岁健康湖羊的瘤胃微生物样本(6组,湖羊在取样之前的21天里仅喂食苜蓿)。对6个瘤胃样本进行宏转录组测序,测序结果经过质检、组装、聚类获得独有基因。对独有基因进行CAZymes数据库注释,用于筛选潜在的纤维素酶。针对候选的纤维素酶,通过特异性引物扩增获得基因序列。通过将获得的序列在大肠杆菌中进行异源表达研究纤维素酶的酶活以及环境耐受性。
结果
1. 宏转录组测序结果概述
本研究对6个湖羊瘤胃微生物样本进行宏转录测序,共得到4.9千万条原始序列,通过去接头和质量过滤,得到42.3Gbp的高质量序列。Q20和Q30分别为96.5%和91.4%,平均GC含量为47.2%。通过Trunity自组装和CD-HIT聚类获得2,380,783条独有基因,这些独有基因最短251bp,最长40,135bp,平均长度515bp,其中还大多数独有基因的表达量低于10 FPKM.
2.CAZyme注释和物种分类
所有的独有基因中有110,157条基因属于CAZymes,分为125,252种(一条基因可能有两种CAZyme功能),包括63,153个GHs(糖苷水解酶),24,599个GTs(糖基转移酶),7631个CEs(碳水化合物酯酶),3245个PLs(多糖裂解酶),138个AAs和26,486个CNMs(碳水化合物结合结构域基因)。其中GH基因具有最高的表达量(图1a)。这些GH基因属于111不同的糖苷水解酶家族,其中最大的家族为GH2,GH3,GH13和GH43(图1b)。一共14,489个独有基因被注释到已知的纤维素酶相关的GH家族(GH1, GH3, GH5, GH6, GH8, GH9, GH12, GH30, GH44, GH45, GH48, GH51, GH74, GH116和GH124),其中GH3,GH5和GH9包含了10,810条独有基因(74.6%)(图1b)。
通过调查本研究中的独有基因与CAZy数据库中氨基酸序列的相似度,14,489条纤维素酶基因中仅有1.3%的基因相似度达到95-100%,14.0%的基因相似度在75-95%之间,84.7%的基因相似度低于75%。统计与NCBI nr数据库中氨基酸序列的相似度,6.4%的基因相似度达到95-100%,36.7%的基因相似度仅有75-95%,剩下的63.3%的基因相似度低于75%。
110,517条已被注释到CAZymes的基因中,注释到物种信息的基因中大部分是细菌来源的(88.6%),其他微生物占比较少,真核微生物1.4%,古菌0.3%,病毒0.04%,其中厚壁菌门和拟杆菌门的独有基因的数量最多,分别占了18.7和13.8%。除此之外依然有65.6%的基因未被成功注释(图2)。
图1 CAZyme基因注释结果。a 注释到CAZy家族独有基因的数量和相对表达丰度;b 独有基因中注释到GH家族的种类以及数量。
图2 CAZymes的物种分布特征(门水平)。图中左侧和右侧分别显示CAZyme家族以及相对应的物种信息,最外层环代表相对丰度。
3. 鉴定纤维素酶基因
14,486条假定的纤维素酶基因中,4225条具有较长(大于等于600bp)的阅读框(ORF)。在这些阅读框中,鉴定到:2151的催化区域(CDs),属于11个GH家族;147个CBMs,属于8个CBM家族。类似于独有基因的分布,大多数含有CD的ORFs属于GH3(41.6%),GH5(20.3%),GH9(12.4%),CBM模块中以CBM_3和CBM_9为主(表1)。
表1. 湖羊瘤胃中纤维素酶结构域和碳水化合物结合结构域的丰度
4. GH5家族中候选纤维素酶的系统发育关系和微生物来源
系统发育树分析显示大部分GH5纤维素酶候选者可被划分为8个簇(图3),仅有一小部分未能被聚类。大多数的假定纤维素酶来源于细菌。除了簇3的13个基因的表达量高于10 FPKM之外,其余大部分的表达量低于1 FPKM。
图3 GH5家族中候选纤维素酶的系统发育关系和微生物来源。根据进化距离进行分簇,不同颜色代表不同的分类簇。最外圈代表物种分类。
5.GH5基因的功能验证
本研究选择54个ORFs来验证纤维素酶活性,特异性引物扩增结果显示,30个基因的扩增产物大小与预计的一致,其中21个基因与宏转录组中的相似度为100%,剩下的9个相似度大于95%。目前扩增出来的30个基因与数据库中相似度为38-99%,大部分是低于67%的。这些基因的氨基酸序列长度在303到807之间(表2)。
将这30个基因克隆到大肠杆菌中,其中19个基因表现出水解酶活(下列底物其中一个):羧甲基纤维素(CMC),p-硝基苯基-β-D-纤维二糖(pNPC),p-硝基苯基-β-D-葡萄糖(pNPG)。其中17个具有内切葡聚糖酶活性,7个具有外切葡聚糖酶活性,5个同时具备内切和外切葡聚糖酶活性,没检测到β-葡糖苷酶活性(图4a)。Cel5A-h28和Cel5A-h49具有最高的特异性内切葡聚糖酶活性(22.2和115.6U/mg)(图4b),Cel5A-h11和Cel5A-h38具有最高的特异性外切葡聚糖酶活性(142.8和98.6U/mg)(图4c)。
Cel5A-h11和Cel5A-h28分别以pNPC和CMC为底物,最适温度分别为40和50 °C(图5a)。在40 °C下处理60 min后,Cel5A-h11和Cel5A-h28的残余酶活力依然保存在70和60%。但是在50和60°C下处理后,这两种酶的酶活极速下降(图5b)。对于pH,两种酶的最适pH均为6.0(图5c)。在pH4.0和9.0条件下处理16h后,Cel5A-h11和Cel5A-h28的残余酶活力保存在80和60%。
表2. 30个候选纤维素酶(GH5来源)的基因信息
图4 候选纤维素酶的酶活以及底物特异性。a 19种具有水解活性的纤维素酶,b CMC水解酶酶活测定,c pNPC水解酶酶活测定。
图5 温度和pH对Cel5A-h11和Cel5A-h28催化活性的影响。a: pH为6.0的条件下,温度对酶活的影响;b: 不同温度(40, 40, 60°C)下处理不同时间(2, 5, 10, 20, 30, 40, 50, 60min)后,在最适pH和温度条件下的残余酶活力;c: 最适温度下,pH对酶活的影响;d: 不同pH(3.0-10.0)下孵育16h后,在最适温度和pH下的残余酶活力。
结论
本研究结果表明,湖羊瘤胃消化系统中存在大量的纤维素酶,大部分都是之前数据库中未报道的。瘤胃中的纤维素酶主要来源于厚壁菌门和拟杆菌门的微生物,可能是食物中植物生物质的主要降解者。通过在大肠杆菌异源表达结果发现了具有较高温度和pH耐受度的纤维素酶,可进一步作为生产生物燃料和加工饲料的催化剂。
评论
纤维素生物质是一种由葡萄糖作为单体组成的多糖,植物的主要组成成分,在不同生态系统中广泛分布。目前可开采的化石能源日益减少,纤维素生物质可通过生物转化生成生物燃料,作为一种替代的清洁能源。其中纤维素酶在生物质转化为生物燃料以及其他有价值产品中扮演着重要的角色。反刍动物的肠道、瘤胃的微生物具有纤维素的降解能力,是挖掘新型纤维素酶的宝贵资源。本研究通过宏转录组学揭示了湖羊瘤胃存在大量的新型纤维素酶,通过以大肠杆菌为宿主进行异源表达,发现了具有较高的环境耐受性(温度和酸碱环境)的新型纤维素酶,具有较高的工业应用价值。
你可能还喜欢