StoneMod:肾结石调节蛋白数据库
StoneMod: a database for kidney stone modulatory proteins with experimental evidence
需要更好地了解肾结石形成的分子机制,以改善肾结石疾病的管理并获得更好的治疗效果。最近的肾结石研究表明,一组蛋白质(即“结石调节剂”)在促进或抑制结石形成方面发挥着关键作用。然而,这些信息目前分散且难以获得。在此,我们介绍了肾结石调节剂数据库 (StoneMod),该数据库是通过获取此类结石调节蛋白的必要信息(可作为结石促进剂或抑制剂)以及来自先前发表的研究的实验证据的精选资源。目前,StoneMod 数据库包含分别影响草酸钙结晶、晶体生长、晶体聚集和晶体粘附在肾小管细胞上的 10、16、13、8 种调节蛋白。提供了每种调节蛋白的详细信息和已发表文章的 PubMed 链接。此外,还为用户提供了指向其他蛋白质/基因数据库(例如 UniProtKB、Swiss-Prot、Human Protein Atlas、PeptideAtlas 和 Ensembl)的超链接,以获得每种蛋白质的其他深入信息。此外,该数据库提供了一个用户友好的网络界面,用户可以在其中自由访问信息和/或提交他们的数据以进行存储或更新。数据库网址:https://www.stonemod.org。
Introduction
肾结石疾病是世界范围内常见的健康问题。尽管肾结石形成的确切机制仍不清楚,但涉及致病离子(例如钙和草酸离子)的管内过饱和和致病晶体的间隙沉积(即 Randall 鼠疫模型)的两个主要假设已被广泛接受 1,2。尽管如此,该疾病的发病率/患病率一直在增加 3,反映出预防无效和对该病发病机制了解不足。因此,过去几十年的结石研究试图在组织、细胞、亚细胞和分子水平上解决肾结石形成的机制 4,5。此类研究的一个方面引起了许多研究人员的广泛关注,其中一个方面是对晶体调制的研究,其最终目标是更好地了解结晶、晶体生长、晶体聚集和晶体与肾小管细胞 1,2 的粘附过程,这是必不可少的肾结石形成,并确定抑制这些过程的策略4,5。来自 > 70个国家和不同地区的众多团体对肾结石调节的研究进行了广泛研究,自1900年代以来,此类研究已发表 > 4,800篇PubMed文章(图1)。
图1
基于出版年份 (A) 和原产国 (B) 的与肾结石调制研究相关的已发表文章数量。(其他 = 58 个国家/地区以外的其他国家/地区;未定义 = PubMed 数据库中未提供从属关系)。
在尿液和肾脏组织中,有一组分子,包括蛋白质,它们可以通过促进或抑制结石形成过程的每个步骤来调节肾结石的形成。例如,尿三叶因子 1 (TFF1) 可以抑制草酸钙晶体生长和聚集 6,7,而 bikunin(尿胰蛋白酶抑制剂或 α-1-微球蛋白)可以抑制草酸钙结晶、生长和聚集 8,9。然而,一些结石调节蛋白对结石调节作用不明确,如 Tamm-Horsfall 蛋白(尿调节蛋白),它促进草酸钙晶体聚集,但另一方面,抑制晶体生长 10,11。不幸的是,尽管在肾结石研究中付出了巨大的努力,但这些参考文献是分散的,而且这种相互矛盾的结果很容易引起混淆。因此,必须为肾结石调节剂生成资源或数据库,使研究人员能够快速准确地获得现有调节剂的精确信息及其对肾结石形成的影响。
我们在此介绍了肾结石调节剂数据库 (StoneMod),该数据库利用先前发表的研究中的实验证据对所有肾结石调节剂进行管理和编目。由于草酸钙是最常见的肾结石类型,在分析的 111,196 颗结石中占 > 77% 12,并且用于研究草酸钙肾结石形成过程的分析方法已经完善,因此该版本的数据库侧重于草酸钙结晶、晶体生长的调节剂、聚集和粘附于肾小管细胞。
Results and discussion
结果和讨论
StoneMod 数据库概述
我们目前工作的目的是建立一个数据库,将肾结石调节剂的所有相关信息与实验证据相结合。StoneMod 数据库提供了一组调节蛋白,可促进或抑制肾结石形成的各个步骤。使用预定义的纳入/排除标准(图 2)(更多详细信息参见“材料和方法”),StoneMod 数据库目前包含 10、16、13、8 种影响草酸钙结晶、晶体生长、晶体聚集的调节蛋白和晶体粘附在肾小管细胞上,分别(表(表1)。1)。所有这些数据均来自 62 项已发表的研究,涉及尿液、血清、细胞分泌组和肾组织样本(补充表 S1)。提供了每种调节蛋白的详细信息和已发表文章的 PubMed 链接。此外,还为用户提供了指向其他蛋白质/基因数据库(即 UniProtKB、Swiss-Prot、Human Protein Atlas、PeptideAtlas 和 Ensembl)的超链接,以获得每种蛋白质的其他深入信息。
图2
生成 StoneMod 数据库的数据收集和管理工作流程示意图。
选项卡式文档界面
StoneMod 数据库网站是一个开放访问资源,用于获取肾结石调节蛋白的详细信息,该网站的设计和组织旨在便于使用和访问。使用“材料与方法”(图 3)中详述的 MySQL 模式,该初始阶段的网站选项卡式文档界面包括“主页”、“关于我们”、“列表”、“高级搜索”、“数据提交” 、“联系人”和“帮助”选项卡(图 4A)。主页提供了数据库的概述、肾结石形成的简要背景以及数据库的新闻或相关问题(图 4A)。此页面还显示了三种最新的调节蛋白及其调节活性。
图 3
用于生成 StoneMod 数据库的 MySQL 模式。主关系数据库由十二个表组成,代表了用于数据库构建的所有相关参数。
图 4
StoneMod 数据库的展示和外观。(A):带有各种选项卡式文档界面的主页。(B):按字母顺序列出。(C):按活动列出。(D):首页快速搜索。(E):使用指定关键字的高级搜索。(F):白蛋白的搜索结果页面。
列表菜单提供两种选择,其中调节剂按字母顺序或按涉及结晶、晶体生长、晶体聚集或晶体粘附在肾小管细胞上的活动排序(图 4B、C)。对于肾结石形成的每个步骤,单个调节蛋白按其调节作用(例如,促进或抑制)进行分类。可以使用通用关键字(例如蛋白质通用名称、蛋白质替代名称、基因名称、基因符号、UniProtKB 登录号等)通过主页进行快速搜索(图 4D)。这允许用户直接访问感兴趣的蛋白质或调节剂的信息。除了快速搜索之外,用户还可以通过输入指定的多个搜索参数来执行高级搜索(图 4E)。在任何一种情况下,搜索结果都会显示生成的调制器的简要信息,包括它的 StoneMod ID、蛋白质名称、UniProt ID、基因名称和基因符号(图 4F)。单击蛋白质名称将引导用户查看每个调节蛋白质的详细信息(图 5)。
图 5 详细信息页面。(i):蛋白质的一般信息。(ii):基因的一般信息。(iii):调节作用。
详细信息页面包含各调节蛋白的相关数据,包括:(i) 蛋白质信息;(ii) 基因信息;(iii) 调节作用(表(表 2)。2)。蛋白质信息(主要从 UniProtKB 数据库中检索)包括蛋白质通用名称、替代名称、UniProt ID、蛋白质同种型(如果有)和蛋白质组数据库(即人类蛋白质图谱和肽图谱)的超链接(图 5;面板) (一世))。基因信息(主要从 NCBI 基因数据库中检索)提供基因名称、基因符号和基因注释数据库(即 Ensembl)的超链接(图 5;面板 (ii))。每个调节剂的调节作用的详细信息(主要从 PubMed 搜索中检索)包括其对结晶、晶体生长、晶体聚集或晶体粘附的促进或抑制作用的所有相关参考文献(图 5;面板 (iii))。每个类别中的参考文献数量也汇总并显示在此页面上。每个参考文献都进一步链接到 PubMed 文献资源。最后,StoneMod 数据库还允许用户通过单击详细信息页面底部的“导出到 csv”图标(图 5;面板(),以逗号分隔值(csv)文件格式下载或导出所有详细信息。iv))。
表 2 StoneMod 数据库中提供的相关信息的详细信息。
不同研究显示出相互矛盾的结果(主要是由于测试的不同设置/参数)。然后将它们列在“按活动列出”选项卡中的“矛盾”类别中。例如,有三种调节剂(白蛋白、骨桥蛋白和尿调节蛋白)属于晶体生长的“矛盾”类别(图 4C)。每种蛋白质的详细信息页面将在一个地方显示所有相互矛盾的数据(如图 5 中白蛋白的情况;面板 (iii),其中“调节作用”部分显示了白蛋白抑制和促进作用的所有参考文献关于晶体生长。
数据提交和更新
除了我们团队定期(每月)存入和更新外,StoneMod 数据库还在“数据提交”选项卡(图 4A)上提供了一个提交表单,允许用户直接将自己的信息存入或手动更新到数据库中(请注意,用户必须提供已发表文章的 PubMed ID 或数字对象标识符 (DOI))。提交后,每个填写的表格将直接发送给我们进行审核。如果提交的参考文献是相关的,并且显示了其蛋白质对肾结石形成的调节作用的实验证据,则它们将在提交后一周内存放并在网站上更新。最后,最新存入的调制器将在主页上突出显示,提交者将被记入并通知。
结论
StoneMod 是第一个提供肾结石调节蛋白相关信息和实验证据的基于网络的数据库。该数据库的元素通过用户友好的 Web 界面易于使用。StoneMod 数据库的功能使用户可以在一个地方自由访问此类信息。此外,用户还可以提交他们的数据进行存储和更新。因此,该数据库将成为肾结石研究界的宝贵信息资源。
数据收集和整理
肾结石调节数据是从已发表的具有实验证据的研究文章中收集和整理的。最初,所有相关文章都是使用关键字从 PubMed 数据库中检索到的:““草酸钙”[所有字段] AND (“促进”[所有字段] OR “抑制”[所有字段] OR “减少”[所有字段] OR “ modulate"[All Fields] OR "prevent"[All Fields] OR "enhance"[All Fields]) AND English[lang] NOT Review[ptyp] NOT system[sb] NOT Comment[sb] NOT Editoring[ptyp]”(图2)。此后,通过仅包括具有调节肾结石形成过程的实验证据的哺乳动物蛋白质来手动过滤数据。对于蛋白质信息,UniProtKB (https://www.uniprot.org/) 用于检索通用名称、替代名称、异构体和 UniProtKB ID13。人类蛋白质图谱 (https://www.proteinatlas.org/)14 和 PeptideAtlas (https://www.peptideatlas.org/)15 也用作蛋白质注释数据库。对于基因信息,基因名称和符号是从 NCBI 基因数据库(https://www.ncbi.nlm.nih.gov/gene)16 中检索到的。基因名称和基因符号遵循 HUGO(人类基因组组织)基因命名指南 17。从 Ensembl 数据库 (https://www.ensembl.org/)18 检索基因注释。每种调节蛋白根据其对肾结石形成过程(即结晶、晶体生长、晶体聚集和晶体粘附在肾小管细胞上)的影响(促进或抑制)进行分类。然而,当参考文献显示不确定或矛盾的数据时,蛋白质被归入矛盾的类别。
数据库实现
StoneMod 数据库网站是使用 WampServer (https://www.wampserver.com) 构建的,WampServer 是一个免费的开源跨平台服务器,支持在 Linux 子系统中使用 Apache2、PHP 和 MySQL 应用程序和创建数据库。之所以选择 MySQL 工作台 (https://www.mysql.com) 来管理 StoneMod 数据库,是因为它易于使用。StoneMod 数据库使用的 MySQL 模式如图 3 所示。主要关系数据库由十二个参数表构成,包括蛋白质、基因、异构体、结晶、生长、聚集、粘附、效应、结晶概要、生长、聚集总结和粘附总结。每个表都包含以列和数据类型表示的信息,以及通过关系到其他表的链接。PHP 还与 MySQL 结合用作服务器端脚本。此外,Web框架开发Bootstrap(https://getbootstrap.com/)是目前最流行的响应式网站开发框架,JavaScript框架开发JQuery(https://jquery.com/)用于开发网页界面。