MPB:华大孙海汐等-从细菌基因组中预测活性前噬菌体工具Prophage Hunter的使用流程和常见问题

为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅读原文下载PDF审稿。在线文档(https://kdocs.cn/l/cL8RRqHIL)大众评审页面登记姓名、单位和行号索引的修改建议。修改意见的征集截止时间为推文发布后的72小时,文章将会结合有建设性的修改意见进一步修改后获得DOI在线发表,同时根据贡献程度列为审稿人或致谢。感谢广大同行提出宝贵意见。

从细菌基因组中预测活性前噬菌体工具Prophage Hunter的使用流程和常见问题

The Usage Process and Common Problems of Prophage Hunter, a Tool to Capture Active Phage from the Bacterial Genome

孙海汐1, 2, #, *,李敏1, 2, 3, #,宋文琛1, 2, #,肖敏凤1, 2, 3, *

1.深圳华大生命科学研究院,深圳;2.深圳市未知病原体应急检测重点实验室,深圳;3.中国科学院大学华大教育中心,深圳

*通讯作者邮箱: xiaominfeng@genomics.cn; sunhaixi@cngb.org

#共同第一作者/同等贡献

摘要:识别具有活性的前噬菌体,对于研究噬菌体和细菌的协同进化、噬菌体的生理生化以及工程化设计噬菌体等多种用途至关重要。这里,我们介绍了Prophage Hunter,该工具旨在从细菌的全基因组序列中寻找具有活性的前噬菌体。结合序列相似性的匹配及基于遗传特征的机器学习分类模型,我们开发了一种新颖的评分系统,该系统在验证数据集上预测活性前噬菌体中表现出比当前工具更高的准确性。该工具也可以选择跳过序列相似性匹配,这样有更多可能发现新颖的前噬菌体。Prophage Hunter提供一站式网站服务,包括从细菌基因组中提取前噬菌体基因组、评估前噬菌体的活性、鉴定系统发育相关的噬菌体、注释噬菌体蛋白的功能及可视化前噬菌体基因组位置信息等。Prophage Hunter可在https://pro-hunter.genomics.cn/免费使用。

关键词:前噬菌体,细菌,机器学习,注释,一站式分析

仪器设备

1.个人电脑:安装主流浏览器 (Chrome/Safari) 即可

实验步骤

1.准备输入数据:细菌基因组序列,可包含一条或多条序列 (FASTA格式,图1)。

图1. FASTA格式序列

2.在浏览器中输入https://pro-hunter.bgi.com/,进入网站主页 (图2)。

图2. Prophage Hunter网站主页

3.在网页的导航栏上单击"Start Hunting (开始狩猎)"按钮启动Prophage hunter程序 (图3)。

图3. 单击红色框中的Start Hunting (开始狩猎) 按钮以启动程序

4.在主页上,单击"Browse (浏览)"将一个或多个核苷酸序列以FASTA文件格式上传到网站 (图4a)。默认情况下,Prophage Hunter使用相似性搜索策略来标识初始前噬菌体区域。也可以通过勾选"Skip similarity matching (跳过相似性匹配)"框 (图4b),用户可以跳过此过程以识别新型噬菌体。本示例以地衣芽孢杆菌Bacillus licheniformis DSM 13 (Accession Num.:NC_006322.1) 为输入。

图4. 单击"Browse (浏览)"上传FASTA文件

5.可选择输入电子邮箱地址以接收指向分析报告的超链接 (图5)。请注意,此超链接将在一周后过期。若不输入,则需在提交序列后跳转的分析页面等待分析完成,或自行将提交序列后跳转的分析页面链接复制保存,以便查看结果(详见步骤7、8)。

图5. 输入电子邮件地址以接收分析报告

6.勾选以加入"Join User Experience Improvement Program (用户体验改善计划)" (图6a)。有关更多详细信息,请单击"Join User Experience Improvement Program (用户体验改善计划)" (图6b)。

图6a. 勾选加入用户体验改善计划

图6b. 用户体验改善计划具体信息

7.点击"START HUNTING (开始狩猎)"按钮开始分析。

图7. 开始分析

8.分析完成需要等待5-15分钟,分析完成后点击蓝色区域链接即可到达结果页面 (图8)。

图8. 等待分析完成

结果

1.在结果页面的顶部是一个基因组浏览器,显示了每个预测的前噬菌体区域 (图9a)。活性前噬菌体区域(Category 为Active)和模糊区域(Category 为Ambiguous,即难以判断活性的前噬菌体区域)分别以天蓝色和灰色着色 (图9b)。若提交文件中含有多个序列,用户可以通过单击左上方的下拉菜单切换到基因组的其他染色体或Scaffold序列 (图9c)。

图9. 基因组浏览器显示预测的前噬菌体区域的基因座和活性类别

2.在结果页面底部的表格显示了每个预测的前噬菌体基因组区域的详细信息 (图10a):

- Candidate ID (候选ID):预测的前噬菌体基因组区域的ID;

- Sequence ID (序列ID):输入文件中显示的细菌基因组序列ID;

- Start (开始):预测的前噬菌体基因组区域的开始位置;

- End (结束):预测的前噬菌体基因组区域的结束位置;

- Length (长度):预测的前噬菌体基因组区域的长度;

- Category (类别):预测的前噬菌体基因组活性类别,Active表示预测为具有活性(Score > 0.8),Ambiguous表示该预测区域活性难以判断 (0.5 < Score < 0.8);

- Score (分数):预测的前噬菌体基因组活性分数,分数越高,支持预测区域的活性证据越强;

- Closest phage (最近源的噬菌体):与现有噬菌体库相比,预测的前噬菌体区域最近源的噬菌体," N/A"表示未在噬菌体库中找到近源噬菌体;

- Gene number (基因数目):预测的前噬菌体区域内基因的数目。

图10. 每个预测的前噬菌体区域详细信息。

用户可以单击相应的按钮以下载对应预测的前噬菌体区域的基因组DNA序列、CDS序列或蛋白质序列 (图10b) 或所有分析结果 (图10c)。用户还可以单击最接近的噬菌体的分类名称以查看详细信息 (图10d)。

3.在结果页面顶部的基因组浏览器或下方的表格中单击预测的前噬菌体区域,可以查看预测的前噬菌体区域每个基因的注释情况 (图11a) 和与该区域同源的前5个最接近的噬菌体 (图11b)。本示例为点击表格中 Candidate 22 。

图11a. 预测的前噬菌体中基因在数据库中 (NCBI NR、Pfam和InterPro) 的注释情况

图11b. 与预测区域同源的前5个最接近的噬菌体

致谢

本项目由国家重点研发计划项目 (2020YFA0908700)、深圳市孔雀团队项目(KQTD2015033117210153)支持。

参考文献

1.Song, W., Sun, H. X., Zhang, C., Cheng, L., Peng, Y., Deng, Z., Wang, D., Wang, Y., Hu, M., Liu, W., Yang, H., Shen, Y., Li, J., You, L. and Xiao, M. (2019). Prophage Hunter: an integrative hunting tool for active prophages. Nucleic Acids Res  47(W1):W74-W80.

(0)

相关推荐

  • CRISPR-Cas9基因敲除技术原理

    这是一篇针对实验室萌新写的关于CRISPR-Cas9技术的详细介绍,对于实验室老手也建议收藏转发给师弟师妹,这样省心省力,又能节省大量讲解时间,这不香么? 原核生物的"免疫系统" ...

  • 【连载】噬菌体vs细菌:宿命的对决III

    三:噬菌体群落的研究方法 病毒对人类.动物.植物和微生物群落有着深刻的影响,但关于这个群体,我们还缺乏足够的认知.在讨论这个问题之前,首先我们要弄清楚类病毒颗粒(Virus-like particle ...

  • 【LorMe周刊】小身体·大能量--噬菌体的基因组学时代

    作者:李婷婷,南京农业大学硕士在读.主要研究根际噬菌体-青枯菌共进化动态. 周刊主要展示LorMe团队成员优秀周报,每周定期为您奉上学术盛宴!本期周刊为您介绍早期的噬菌体基因组学研究.原文于2002年 ...

  • 陈根:14多万肠道病毒,和病毒共生存

    文/陈根 病毒是地球上数量最多的生物实体.当然,病毒有好坏利弊之分,人类肠道作为一个极其复杂的生态环境,除了细菌外,更有数十万种噬菌体病毒也生活在其中. 噬菌体通过创建促进生态适应的基因流网络来驱动细 ...

  • 综述 | Nature Communications:一类广泛存在于人体肠道的拟杆菌肽毒素

    编译:木子依虫,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 细菌通常产生抗微生物毒素以在微生物群落中取得竞争优势.本文利用表型,突变,生物信息学和宏基因组分析研究了由拟杆菌产生的拟杆菌毒素的 ...

  • 一鸣惊人:反转录子基因编辑,超越CRISPR,谱写基因编辑新篇章

    撰文 | 王聪 编辑 | nagashi 排版 | 水成文 细菌与噬菌体之间的军备竞赛导致细菌发展出了精妙的防御系统,近年来生命科学领域最大的突破--CRISPR基因编辑技术,正是从细菌的防御系统发展 ...

  • 宏病毒组分析常见的分析软件

    病毒是地球上数量最多的生物实体,其中细菌病毒(即噬菌体)约有1031个类群,从海洋到陆地再到人体几乎都是它们的栖息地.研究者将病毒视为调节人类生态系统的重要成员,人体内主要包括真核病毒和噬菌体,包括双 ...

  • 【LorMe周刊】细菌和古菌多重抗性系统抵御噬菌体和外来质粒

    作者:李婷婷,南京农业大学硕士在读,主要研究根际噬菌体疗法 周刊主要展示LorMe团队成员优秀周报,每周定期为您奉上学术盛宴!本期周刊为您介绍细菌和古菌针对噬菌体和质粒进化出的除已知抗性系统之外的多重 ...

  • 孙海义-《姓名学》二、姓名与八字命运

    转自:玄学通风水师的博客 二.姓名与八字命运 人生的命运或因自己的奋斗,努力而创造,或因祖先余阴,人事背景,容貌美恶等等左右,而影响力最深远巨大者莫过于八字与姓名. 俗云:"人的命天注定,胡 ...

  • 孙海义-《姓名学》四、姓名学相关知识(1)

    转自:玄学通风水师的博客 姓名文字笔划计算方法,在整个姓名预测学中,占有重要位置,因笔划计算错误,所测姓名就全部出错.在算笔划时,要按照康熙字典上的字划为准. 姓字学文字笔划部首,有特殊的规定: 1. ...

  • 孙海义-《姓名学》四、姓名学相关知识(2)

    5.起名宜忌 起名应当禁忌什么?也就是应当避免什么,注意些什么呢?这方面的内容较多,具有普遍意义的也有二十多种. 1.忌用"丑陋"字起名. 2.忌用"凶坏"字起 ...

  • 孙海义-《姓名学》五、五格与三才的关系

    转自:玄学通风水师的博客 五.五格与三才的关系 1 张11     天格12 佳8       人格19 欣8       地格16 外格9  总格27 假1 李7       天格8 博12     ...

  • 孙海义-《姓名学》七、数之吉凶

    转自:玄学通风水师的博客 七.数之吉凶 大千世界,宇宙之中,万物根源在于数.数者始于1,终于10,循环无穷,且次序不乱,这是大宇宙的真理,而各数则含有大自然的力量.天地有阴有阳,物体刚柔表里,而数字则 ...

  • 孙海义-《姓名学》八、姓名预测学(1)

    转自:玄学通风水师的博客 八.姓名预测学 这里所讲的姓名学知识,不但能指导如何起个好名,更能从名字中预测一生之事业.祸福.财官.婚姻,以及六亲性格等.严格的说,这是一部姓名预测书.因起名离不开文字,早 ...

  • 孙海义-《姓名学》八、姓名预测学(2)

    转自:玄学通风水师的博客 2.姓名预测学基本方法 要想通过一个人的名字测准其一生信息,首先必须了解汉字的结构及五行基础知识. 汉字的结构其实非常简单,无论任何汉字都不越横"一 ", ...

  • 孙海义-《姓名学》八、姓名预测学(3)

    4.名字中的六亲位置(宫位) 三字名,以姓氏为祖上父母宫,以中间字为夫妻宫以未一字为子女宫. 二字名,以姓氏为祖上父母宫,以第二字为夫妻儿女宫. 姓名学中如何界定"自身". 根据上 ...

  • 孙海义-《姓名学》八、姓名预测学(5)

    转自:玄学通风水师的博客 9.姓名与命运 一个人的名字与命运有关系吗?回答是肯定的.那么命运是什么呢?任何人都要受到一种神秘的力量支配,无论你是帝王也好,是乞丐也罢,都要受到这种神秘力量安排好的人生轨 ...