m6A-seq 数据处理及图表复现交流群

但很多粉丝留言表示这些英文教程看不懂,数据也很分散,没有中文解说实在是很难跟下来,希望我们出一个手把手系列教程。

这个全套 MeRIP-seq 图表复现代码在GitHub:https://github.com/al-mcintyre/merip_reanalysis_scripts  这个也是接近2G的压缩包!

其实很早以前我就在《生信技能树》发布过教程:新的ngs流程该如何学习(以CUT&Tag 数据处理为例子),提到了我自己是不太可能去把所有的ngs流程全部录制视频的,只能说是更好的传达学习方法给到大家。其实如果你看过我表观组学,比如《ChIP-seq数据分析》《ATAC-seq数据分析》 就会发现其实这个m6A数据处理大同小异的,当然了,肯定是会有一些细微差异是需要注意的。

虽然我没有时间,但是我们的两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,还是有幸招募到了愿意花时间给大家做整理的小伙伴。所以有了这个MeRIP-seq 图表复现交流群。

01-文献解读|在人的四种不同组织中m6A甲基化的遗传驱动因素

1.文献信息

标题:Genetic drivers of m6A methylation in human brain, lung, heart and muscle

发表时间:2021年7月1日

杂志:Nature Genetics(2020IF=27.605)

作者:麻省理工学院计算机与人工智能实验室Manolis Kellis课题组

数据和方法

主要数据

image-20210711235626527

可以看到,样本量还是蛮可观的!

m6A meRIP–seq across human tissues

文章主要使用的链特异性建库和双端45bp的测序策略,第一次遇到测这么短的啊:

We used the SMARTer Stranded RNA-Seq Kit from Clontech/Takada, which is optimized to work with 100pg of starting material. The libraries were sent for 2×45-base-pair paired-end sequencing.

甲基化数据提到的数据库为eGTEx,可以参考:https://cloud.tencent.com/developer/news/397979 进行此数据库的了解。

分析流程:

  • 1.去除tRNA和rNRA:使用bowtie2将read比对到tRNA和rRNA,保留 the unmapped reads
    • tRNA:downloaded from the University of California, Santa Cruz Table Browser
    • rRNA:downloaded from the National Center for Biotechnology Information Nucleotide database
  • 2.比对到参考基因组:使用hisat2 比对到the hg38 human genome:GENCODE (v26; downloaded from https://gtexportal.org/home/datasets
  • Peak calling:MACS2

我们后续就按照这个流程来进行图表复现!

主要结果

这是一篇研究quantitative trait loci(QTL)与m6A修饰关联的文章,我们这次主要关注m6A的地方,即结果1。

结果1:m6A variation across tissues and individuals

107个病人共176个样本,在QC之后,剩余91个病人129个样本做分析:53 brain, 12 heart, 32 muscle

and 32 lung samples,见下图A。

Peak calling共得到>278,000个peak位点(每个位点至少在两个病人中存在),平均每个样本约20,000个位点。

这些Peaks中,与以前的结果相比,有很多都是以前未检测到的peak。比较的对象是来自数据库RMBase v2.0中发表的peaks。

RMBase v2.0: deciphering the map of RNA modifcations from epitranscriptome sequencing data

并且,检测到的Peaks位点的主要集中在终止密码子附近。

 

作者还将以前没有检测到的m6A位点序列特征分布也绘制了一个图,如下,这个图5’UTR位置的信息要比终止密码子的信号值高:

image-20210712011454191

保守序列特征:GGACH

image-20210712011135022

利用m6A谱对样本进行相似性分析,发现组织类型是主要的差异来源,与基于RNA表达谱的样本相似性分析结果类似。

基于m6A谱的样本相似性聚类:

基于RNA表达谱的样本相似性聚类:

具有组织特异m6A修饰位点的基因的功能富集结果显示,组织功能相关功能富集:

此外,作者还对具有组织特异性m6A修饰位点的基因进行了展示:

这些具有m6A修饰位点信息的基因可以在数据库进行查询展示:https://www.gtexportal.org/home/browseEqtls?location=chr1%3A750000-850,000

  • 大脑特异m6A修饰的POU3F2基因:

  • 肺特异的m6A修饰EGFR 基因

 

最后,不同组织总都有m6A修饰的基因在不同组织中的表达不差异,具有m6A修饰组织特异的表达 也特异。这表明m6A可以导致其他广泛表达的转录本的组织特异性功能。

 

其他内容结果如下,详细版本可以前往看文献:

结果2:m6A genetic driver discovery and validation

结果3:Tissue specificity of m6A QTLs.

结果4:m6A QTLs and eQTLs sometimes overlap but are mostly independent

结果5:m6A QTLs help interpret GWAS loci

结果6:Tissue-specific m6A-QTL enrichments of GWAS variants

结果7:Novel m6A regulator prediction

非常好的资源:

此篇文章贡献了作者全部的分析代码,如下:

下载链接

http://compbio.mit.edu/m6AQTLs/

可惜的是下载不到数据啊,即使是m6A的bed文件也没有公开,只能在GTEx中进行相关位点信息查询。

如有万能的网友能搞到数据,我就可以给你复现整个文章了。

不过,我还有plan B:准备找一套其他的数据,利用此篇文献的所有代码进行数据分析。后续即将更新~

文末交流群进群方式(有门票)

群聊组建费用18.8元,一个简单的门槛隔绝那些不怀好意的广告营销号!而且这个专辑会承诺不少于10次更新,所有的文献代码数据最后会打包在交流群,前200名可以直接扫描群聊二维码进群,满200人后我们会统一收款!(每个人都是18.8 元,如果你不同意这个象征性收费,请不要进群哈!)

如果上面的二维码无法进群,说明已经满员了,需要我们生信技能树的官方拉群小助手帮忙拉群哦!!!(名额有限,先到先得!!!)

这个时候请直接付款28元给小助手,就可以进群,或者你转发此推文到朋友圈然后截图给小助手,就可以仍然以18.8元进群!

一个简单的门槛,隔绝那些营销号!我们也会在群里共享生存分析相关的资料,仅此而已,考虑清楚哦!

(0)

相关推荐

  • m6A-meRIP-seq结果解读(四)

    ②生物信息分析流程 (1)数据质控: (2)peak鉴定(peak calling)及diff peak分析:基于m6A-seq(IP,抗体富集后获取的测序数据)和RNA-seq(input)测序数据 ...

  • m6a-meRIP-seq联川

    技术路线 分析内容

  • QTL 综合性检索数据库

    前段时间我们介绍过两个 QTL 相关的数据库分别是 SNP2APA 和 lncRNA-QTL.由于只要是和 SN P有关的的都可以来分析 SNP 对于其他性状的影响.所以就会产生很多类型的QTL.例如 ...

  • RNA m6A甲基化测序(MeRIP Seq)是什么?

    m6A(N6-methyladenosine,6-甲基腺苷)是真核生物中最常见最丰富的RNA修饰,作为一种可逆修饰,RNA既可以在甲基化转移酶METTL3/14 等酶的作用下发生m6A甲基化修饰,又可 ...

  • 基于DArT-seq标记的遗传连锁图的构建和茶叶产量的QTL鉴定

    Construction of a DArT-seq marker–based genetic linkage map and identification of QTLs for yield in ...

  • CNS图表复现04—单细胞聚类分群的resolution参数问题

    回顾 我们的CNS图表复现之旅已经开始,前面3讲是: CNS图表复现01-读入csv文件的表达矩阵构建Seurat对象 CNS图表复现02-Seurat标准流程之聚类分群 CNS图表复现03-单细胞区 ...

  • CNS图表复现08—肿瘤单细胞数据第一次分群通用规则

    正文 文章的第一次分群按照 : immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), stromal (CD10+,MME,fibo or C ...

  • CNS图表复现20—第三次分群,以T细胞为例

    前面我们展现了 CNS图表复现08-肿瘤单细胞数据第一次分群通用规则,然后呢,第二次分群的上皮细胞可以细分恶性与否,免疫细胞呢,细分可以成为: B细胞,T细胞,巨噬细胞,树突细胞等等.实际上每个免疫细 ...

  • 重建交流群,欢迎加入,携手征战股市!

    斗指东南,维为立夏,春去夏来.五一长假期间,收到很多股友的问候,笔者这里道一声感谢! 今日就简单回顾一下文章中对医美题材的分析,回到历史文章的当下,在看一下后期表现,笔者文章从挖掘医美板块布局,到退出 ...

  • 混混网络笔记:送礼人情世故交流群(006-011)

    006 儿子开学了,我给儿子的老师包了个1000元的红包,老师婉拒:放心好了,对于孩子我能使多大劲儿,我就使多大劲儿.我硬给,老师接了. 我已经不是小孩子了,什么是真话,什么是客套话,以前我听不出来, ...

  • 哪里有好的交流群?

    昨天还在感叹,陈秋明的群也解散了,这才一天啊,那个神燕就憋不住了,想聊天,没有地方去,跑来说了一堆. 找QQ群聊天,很难吗?这年头,各种群,不是多如牛毛么? 再说了,俺是有公众号的人啊,到处去找,干嘛 ...

  • 虚拟项目&知识变现交流群开放了(限时入群)

    经常有很多粉丝问我,现在有什么好赚钱的项目,我一般都是推荐他们做虚拟项目. 这些年虽然做过不少项目,但大多是做了没多久赚一波钱就走的,没啥积累,而虚拟项目不仅让我持续的赚钱,而且从18年底离职到现在, ...

  • 【全国婚姻家庭帮助交流群】【百年静安】红与黑,万航渡(之一)

    静安寺,百年风云际会. 发端于静安寺的万航渡路曲曲折折.宽宽窄窄,行走其中,浮光掠影之间,中国近现代史的一张张老照片依稀可见. 万航渡路,跨静安区和长宁区,南起愚园路,北至曹家渡折向西,最终与长宁路相 ...

  • 袁毅明:关于英语兴趣班培训项目交流群!

    昨晚,林哥老师,华特少儿英语培训教育国际班的陈主任打电话过来. 说林哥5月份高级班英语要毕业班,可以开始准备6月份的国际班升班了. 国际班的特点: 1.教材采用美国地道英语教材学习;2.重视对学生逻辑 ...