从基因组学解码生命:细胞、组织、器官
全球医生组织
原创 时占祥 全球医生组织 来自专辑美国NIH与国家癌症中心系列讲座
这次新冠疫情成为了最好的生物医学科普宣教。无论男女老少,受教育多少、层次高低,都弄明白了什么是病毒;现在又聚精会神地盯着疫苗,而且还是RNA疫苗,最前沿的高科技。
其实,归根结蒂,人们仍不知道人体的细胞、组织和个体是如何从遗传基因编码中获取信息,然后影响个体发育、健康和疾病,比如有人感染病毒生病,有人却无症状。可见,从基因组解码或揭秘个人生命具有至关重要的意义。
早在2003年,国际生物医学界启动了一项解码DNA百科全书(ENCODE)项目,旨在汇总人类基因组元素,并且定位其功能,后来又拓展至其他生物个体。
日前,该百科全书(ENCODE)又增添了最新发现、最新知识和研究进展,包括验证核实的近6000种实验(涉及人类4834个样品,涉及小鼠1158样品),还包含超过一百万个人和小鼠候选顺式调控元素(cCRE)。
自古以来,人类沿袭了用“百科全书”方式记载获得的新知识,新技术发明和社会所经历的风风雨雨。这也是人类物种发展的足迹。
像1918年全球流感大流行那样,再过百年之后,我们后代的后代肯定会从百科全书中;从各种传记中,以及学术文献中发现2019年底新冠病毒疫情(Covid-19)全球爆发。当然,现在还不知道尾声或结局是怎样。
此次百科全书更新内容还包括各种测定方法、cCRE注册方式。在收录的单篇论文报告中(参见以下目录简介)有新方法的详解描述,此外还包括了新观点、专业评述和研究资源信息等。
对于生物医学界专业人士而言,这些优秀论文和技术方法值得浏览和研读。
为了节省您的宝贵时间,我们将下列研究论文和报告汇集成册,供您下载阅读。关注本微信平台,留言获取。
编码
简介汇集的研究文章和相关内容,描述了DNA编码百科全书,及其数据集和工具。
人类和小鼠基因组中DNA元素
作者总结了DNA元素百科全书项目(第三版)汇总的数据信息,旨在帮助人们更好地理解人类和小鼠的基因组。
宝贵的基因组数据
DNA元素百科全书项目第三版完成了至今为止最全面的目录,其中包含调节人类基因的功能元素。
关于ENCODE的观点
总结了ENCODE项目的历程,ENCODE 第一版和第二版的成就,以及第三版汇总和分析的新数据是如何完善以前的知识和研究进展。
小鼠表观遗传学和基因表达
发育中小鼠胎儿的DNA甲基化动力学
对来自9个发育阶段的12个小鼠组织168个甲基化组的分析,揭示了哺乳动物胎儿发育过程中表观遗传和调控情况。
小鼠胎儿发育中动态染色质景观图集
从12个部位和8个发育阶段小鼠组织中染色质状态和可及性分析,提供了染色质动力学全面视图。
组织和单细胞变化的小鼠胚胎转录组
整个胚胎发育过程中,在17只小鼠组织中的组织水平和发育中肢体中的单细胞水平,对RNA表达进行了定量观测。
小鼠假基因的转录活性和菌株特异性
小鼠假基因是基因组重塑过程的关键标志。作者介绍了小鼠参考基因组和18个近交小鼠品系中假基因的全基因组注释,更新了人假基因注释,并描述了小鼠假基因的转录和进化。
人类基因表达与RNA调控
人RNA结合蛋白规模结合和功能图
五个检测方法组合用于生成RNA结合蛋白,在人细胞中结合的RNA元件目录。
人细胞208个染色质相关蛋白分布
ChIP-seq和CETCh-seq数据用于分析单个人类细胞中208个转录因子和其他与染色质相关蛋白质的结合图,提供了细胞转录因子景观和基因调控网络全面信息。
黏蛋白介导的染色质环在人基因组中的景观
24种人细胞中黏附素介导的染色质环的图谱,可识别出显示细胞类型特异性变异的环,表明染色质环可帮助指定细胞特异性基因表达程序和功能。
关注本微信平台,留言获取
人类转录因子足迹的全球图谱
来自243种人细胞和组织类型的高密度DNaseI裂解图谱,提供了人类转录因子足迹的全基因组核苷酸分辨率图谱。
人DNase I超敏位点指标和生物学谱
来自733个人生物样本的DNaseI超敏位点的高分辨率图谱,用于鉴定和索引人类基因组内的调控DNA。
癌症基因组学集成式编码资源
编码包含数千个功能基因组数据集的资源。作者展示了编码中针对癌症的自定义注释,可以帮助确定肿瘤发生关键要素优先级流程。
系统鉴定人细胞中的沉默子
全基因组筛选可识别人细胞中沉默子区域。缺失与转运蛋白基因ABCC2和ABCG2相关沉默子导致其上调和抗化学性。
RNA结合蛋白等位基因特异性结合揭示了RNA功能性遗传变异
基因变异介导的RNA结合蛋白的差异结合可以影响转录后调控。作者开发了BEAPR,一种用于识别eCLIP-Seq数据中等位基因特异性结合事件的计算方法。
人细胞RNA结合蛋白对RNA编辑调控
科学家考察了200多种RNA结合蛋白在介导A对I RNA编辑中的作用。鉴定了几种以细胞类型特异性方式调节ADAR1表达,相互作用或与Alu元素结合的RNA结合蛋白。
计算分析与工具
预测具有表观遗传模式识别和目标验证的监督增强子
可以转移使用果蝇表观遗传学和STARR-seq数据训练的监督机器学习模型,预测小鼠和人类增强子。
使用连锁不平衡检测不同NGS数据类型中样本交换
临床基因组学中并行分析可能导致样品或数据贴错标签,并对下游产生严重后果。作者提出了一种量化样本遗传相关性并检测此类错误的工具,将其应用于来自编码联盟的数千个数据集。
每年到诺奖季节,国人看到人家获诺总会嘟囔一句“我们也能做,也是诺奖级成果”。“诺奖级”成果应当是自慰吧。
这并非自我贬低或抬高谁。事实上,在生物医学基础研究领域,我们与前沿领域的差距不是按天或月计算,是半个世纪的差距,至少20-30年。