LNCipedia:人类lncRNA数据库

非编码RNA,根据其长度的不同可分为长链非编码RNA和短链非编码RNA。长链非编码并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。研究表明,lncRNA在表观遗传调控、剂量补偿效应、细胞周期调控和细胞分化调控等众多生命活动中发挥重要的作用。

lncRNA与细胞周期和分化、发育、生殖、性别调控、衰老以及多种人类疾病密切相关。lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,这些调控作用也开始引起人们广泛的关注。

LNCipedia

https://lncipedia.org/

LNCipedia是一个公共数据库,用于存储较长的非编码RNA(lncRNA)序列和注释。该数据库整合了多个人类(Human)lncRNA数据库信息,很大程度上解决了lncRNA数据库各自为政的问题。

整合的数据库包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq、NONCODE、FANTOM,多篇文章中的lncRNA记录,并赋予了它们统一ID,同时还包含ncRNA转录本在基因组位置、长度、结构、miRNA结合、lncRNA在其他数据库中相关记录等信息。使用者可以在该数据库中录入、搜索和下载lncRNA相关信息现在已经升级到5.3版本。当前版本包含127,802笔录 和56,946个基因。

具体使用功能:

Search

在导航栏搜索框直接输入ID进行查询,在使用时可以选择资源来源、染色体位置以及类别,网站提供了相关的编码潜力以及ID历史记录转换器。

其中lncRNA,数据库根据以下原则进行了分类:

对于那些与蛋白编码基因所在链相同,而且存在overlap的lncRNA, 如果与所有的exon都没有overlap, 就归类为intronic, 否则归类为sense overlapping;

对于那些与蛋白编码基因的反向互补区间存在overlap的lncRNA, 归类为antisense;

对于那些与任何蛋白编码基因都没有交集的lncRNA, 如果在转录起始位点上游1000bp范围内存在白编码基因的转录起始位点,则归类为bidirectional,  否则归类为intergenic;

点击基因名称后,显示内容包括lncRNA基因ID, 转录本iD, 染色体位置,类别,长度等信息,示意如下如下:

点击Transcript: CASC15:21,可以看到其替代转录名称、替代基因名称、RNA序列,结构体,蛋白质编码潜力,还有 lncRNA保守性。

Locus conservation 是通过lncRNA邻近的蛋白编码基因在不同物种间的保守性,来分析对应的lncRNA的保守性,如果一个lncRNA的参照蛋白编码基因在其他物种中有同源,则认为对应的lncRNA在其他物种中也应该存在。

#Download

我们可以直接从网站上下载lncRNA对应的BED、FASTA、GFF、GTF (UCSC compatible文件,分为完整数据库和高可信度的(已排除可能的蛋白质编码基因版本)两种,下载时需注意,BED提供了GRCh37/hg19和GRCh38/hg38两种版本,示意如下

该网站还提供了API服务, 通过基因id或者转录本id来获取对应的信息,如下:

https://lncipedia.org/api/transcript/HOTAIR:1

https://lncipedia.org/api/gene/HOTAIR

这个数据库的更能内容主要是以上这些,如果文章中使用了该数据库,别忘了引用它们哟:

LNCipedia 5: towards a reference set of human long non-coding RNAsPieter-Jan Volders; Jasper Anckaert; Kenneth Verheggen; Justine Nuytens; Lennart Martens; Pieter Mestdagh and Jo Vandesompele; Nucleic Acids Research 2019

(0)

相关推荐

  • 必看! 2020年科研中的18个高频问题(一)

    2020年快结束了,吉凯基因在此感谢各位老师在过去一年中的大力支持. 2020年的岁末,吉凯基因针对老师们在科研中遇到的一些常见.基础.但又非常重要的问题进行年终总结.搬砖小陈抽丝剥茧,提取出十八个问 ...

  • LncRNA基因敲除技术原理

    LncRNA基因敲除概述 长链非编码RNA(Long Noncoding RNA,LncRNA)指的是长度在200nt以上.不编码蛋白.但参与细胞内多种生物学过程的RNA分子.人类基因组计划研究发现只 ...

  • 非编码RNA(Non-coding RNA)是什么?

    非编码RNA(Non-coding RNA)是指不编码蛋白质的RNA,包括miRNA.lncRNA.circRNA.piRNA等.非编码RNA发挥功能的方式很多,可以与蛋白.DNA和RNA相互作用,参 ...

  • 双向功能(编码和非编码)RNA数据库介绍

    我们都知道,RNA根据其蛋白质编码能力与否分为mRNA和ncRNA,字面意思,mRNA会翻译为蛋白质来发挥作用,而ncRNA则作为调控因子在RNA水平发挥功能.然而越来越多的研究发现,许多先前注释的n ...

  • 长非编码RNA是什么?

    近10年,长非编码RNA(Long noncoding RNAs, lncRNA)的研究热度节节攀升.国自然项目中,lncRNA的中标项目数也不断增加,成为国自然数一数二的热点之一.如果你对2020年 ...

  • 人类lncRNA的表达数据库

    LncRNA一直是近些年来非编码RNA领域的研究热点,所以,许多各式各样的LncRNA数据库应运而生.今天,小编就来给大家介绍一个通过整合lncRNA在广泛的生物学条件下的表达谱来系统表征人lncRN ...

  • 肿瘤转移相关lncRNA数据库

    肿瘤转移相关lncRNA数据库

  • ANNOVAR人类各个数据库变异注释结果表格说明

    转自 鳉鲈的博客转自:http://www.omicsclass.com/article/464ANNOVAR注释结果中各列的表头说明:ID详解Chr染色体Start变异位点在染色体上的起始位置End ...

  • 数据整理这一块工作商业公司可能做得更好-人类lncRNA大全

    有VIP学员咨询我们,该如何整理人类的lncRNA信息做数据挖掘呢? 正好我看到一款商业芯片 Arraystar Human LncRNA Array V4.0 ,上面介绍: Arraystar Hu ...

  • hTFtarget:一个神奇的人类转录因子数据库

    转录因子(TFs)可以通过结合其启动子或增强子的特定DNA序列来调节靶基因的表达.鉴定人中的TF-靶标调控是了解生物学过程(包括发育和发病机制)基础的分子调控机制的基础,而不同条件下的转录因子靶基因的 ...

  • ​ Lnc2Cancer:肿瘤相关lncRNA数据库

    导语 Lnc2Cancer是一个手动管理的数据库,作者在PUBMED提供了lncRNA和人类癌症之间全面的实验支持的关联.中超过6500篇文献中手动收集了LncRNA与癌症之间的关联,完善了lncRN ...

  • DeepMind发布最完整人类蛋白质结构数据库,AI制药领域或迎重大利好丨专家解读

    DeepMind 旗下深度学习模型 AlphaFold2 再掀波澜! 上周,DeepMind 团队刚刚在 Nature 发文,详细公开 AlphaFold2 预测蛋白质三维结构的方法论,并将代码开源. ...

  • 低通量实验验证的功能lncRNA数据库介绍

    说起lncRNA,想必大家不会陌生,作为不同的生物学过程中的关键角色,发挥着重要功能,并与许多人类疾病相关,如癌症,心血管疾病和神经退行性疾病等.但是,并非所有表达的lncRNA都具有功能.所以今天小 ...

  • 人类疾病数据库MalaCards

    MalaCards数据库是人类疾病及其注释的综合汇编.当前版本包括来自74个来源的21369种疾病的信息. 对于每一种疾病,数据库都会显示一张带有关于该疾病的各种注释信息的"疾病卡" ...