m6A-seq 数据处理及图表复现交流群

2024-06-23 17:00:02

但很多粉丝留言表示这些英文教程看不懂，数据也很分散，没有中文解说实在是很难跟下来，希望我们出一个手把手系列教程。

这个全套 MeRIP-seq 图表复现代码在GitHub：https://github.com/al-mcintyre/merip_reanalysis_scripts 这个也是接近2G的压缩包！

其实很早以前我就在《生信技能树》发布过教程：新的ngs流程该如何学习（以CUT&Tag 数据处理为例子），提到了我自己是不太可能去把所有的ngs流程全部录制视频的，只能说是更好的传达学习方法给到大家。其实如果你看过我表观组学，比如《ChIP-seq数据分析》和《ATAC-seq数据分析》就会发现其实这个m6A数据处理大同小异的，当然了，肯定是会有一些细微差异是需要注意的。

虽然我没有时间，但是我们的两次求贤令：曾经我给你带来了十万用户，但现在祝你倒闭，以及生信技能树知识整理实习生招募，还是有幸招募到了愿意花时间给大家做整理的小伙伴。所以有了这个MeRIP-seq 图表复现交流群。

01-文献解读|在人的四种不同组织中m6A甲基化的遗传驱动因素

1.文献信息

标题：Genetic drivers of m6A methylation in human brain, lung, heart and muscle

发表时间：2021年7月1日

杂志：Nature Genetics（2020IF=27.605）

作者：麻省理工学院计算机与人工智能实验室Manolis Kellis课题组

数据和方法

主要数据

image-20210711235626527

可以看到，样本量还是蛮可观的！

m6A meRIP–seq across human tissues

文章主要使用的链特异性建库和双端45bp的测序策略，第一次遇到测这么短的啊：

We used the SMARTer Stranded RNA-Seq Kit from Clontech/Takada, which is optimized to work with 100pg of starting material. The libraries were sent for 2×45-base-pair paired-end sequencing.

甲基化数据提到的数据库为eGTEx，可以参考：https://cloud.tencent.com/developer/news/397979 进行此数据库的了解。

分析流程：

1.去除tRNA和rNRA：使用bowtie2将read比对到tRNA和rRNA，保留 the unmapped reads

tRNA：downloaded from the University of California, Santa Cruz Table Browser
rRNA：downloaded from the National Center for Biotechnology Information Nucleotide database

2.比对到参考基因组：使用hisat2 比对到the hg38 human genome：GENCODE (v26; downloaded from https://gtexportal.org/home/datasets
Peak calling：MACS2

我们后续就按照这个流程来进行图表复现！

主要结果

这是一篇研究quantitative trait loci（QTL）与m6A修饰关联的文章，我们这次主要关注m6A的地方，即结果1。

结果1：m6A variation across tissues and individuals

107个病人共176个样本，在QC之后，剩余91个病人129个样本做分析：53 brain, 12 heart, 32 muscle

and 32 lung samples，见下图A。

Peak calling共得到>278,000个peak位点（每个位点至少在两个病人中存在），平均每个样本约20,000个位点。

这些Peaks中，与以前的结果相比，有很多都是以前未检测到的peak。比较的对象是来自数据库RMBase v2.0中发表的peaks。

RMBase v2.0: deciphering the map of RNA modifcations from epitranscriptome sequencing data

并且，检测到的Peaks位点的主要集中在终止密码子附近。

作者还将以前没有检测到的m6A位点序列特征分布也绘制了一个图，如下，这个图5’UTR位置的信息要比终止密码子的信号值高：

image-20210712011454191

保守序列特征：GGACH

image-20210712011135022

利用m6A谱对样本进行相似性分析，发现组织类型是主要的差异来源，与基于RNA表达谱的样本相似性分析结果类似。

基于m6A谱的样本相似性聚类：

基于RNA表达谱的样本相似性聚类：

具有组织特异m6A修饰位点的基因的功能富集结果显示，组织功能相关功能富集：

此外，作者还对具有组织特异性m6A修饰位点的基因进行了展示：

这些具有m6A修饰位点信息的基因可以在数据库进行查询展示：https://www.gtexportal.org/home/browseEqtls?location=chr1%3A750000-850,000

大脑特异m6A修饰的POU3F2基因：
肺特异的m6A修饰EGFR 基因

最后，不同组织总都有m6A修饰的基因在不同组织中的表达不差异，具有m6A修饰组织特异的表达也特异。这表明m6A可以导致其他广泛表达的转录本的组织特异性功能。

其他内容结果如下，详细版本可以前往看文献：

结果2：m6A genetic driver discovery and validation

结果3：Tissue specificity of m6A QTLs.

结果4：m6A QTLs and eQTLs sometimes overlap but are mostly independent

结果5：m6A QTLs help interpret GWAS loci

结果6：Tissue-specific m6A-QTL enrichments of GWAS variants

结果7：Novel m6A regulator prediction

非常好的资源：

此篇文章贡献了作者全部的分析代码，如下：

下载链接

http://compbio.mit.edu/m6AQTLs/

可惜的是下载不到数据啊，即使是m6A的bed文件也没有公开，只能在GTEx中进行相关位点信息查询。

如有万能的网友能搞到数据，我就可以给你复现整个文章了。

不过，我还有plan B：准备找一套其他的数据，利用此篇文献的所有代码进行数据分析。后续即将更新~

文末交流群进群方式（有门票）

群聊组建费用18.8元，一个简单的门槛隔绝那些不怀好意的广告营销号！而且这个专辑会承诺不少于10次更新，所有的文献代码数据最后会打包在交流群，前200名可以直接扫描群聊二维码进群，满200人后我们会统一收款！（每个人都是18.8 元，如果你不同意这个象征性收费，请不要进群哈！）

如果上面的二维码无法进群，说明已经满员了，需要我们生信技能树的官方拉群小助手帮忙拉群哦！！！（名额有限，先到先得！！！）

这个时候请直接付款28元给小助手，就可以进群，或者你转发此推文到朋友圈然后截图给小助手，就可以仍然以18.8元进群！

一个简单的门槛，隔绝那些营销号！我们也会在群里共享生存分析相关的资料，仅此而已，考虑清楚哦！

赞 (0)

m6A-meRIP-seq结果解读（四）

②生物信息分析流程 (1)数据质控: (2)peak鉴定(peak calling)及diff peak分析:基于m6A-seq(IP,抗体富集后获取的测序数据)和RNA-seq(input)测序数据 ...
m6a-meRIP-seq联川

技术路线分析内容
QTL 综合性检索数据库

前段时间我们介绍过两个 QTL 相关的数据库分别是 SNP2APA 和 lncRNA-QTL.由于只要是和 SN P有关的的都可以来分析 SNP 对于其他性状的影响.所以就会产生很多类型的QTL.例如 ...
RNA m6A甲基化测序（MeRIP Seq）是什么？

m6A(N6-methyladenosine,6-甲基腺苷)是真核生物中最常见最丰富的RNA修饰,作为一种可逆修饰,RNA既可以在甲基化转移酶METTL3/14 等酶的作用下发生m6A甲基化修饰,又可 ...
基于DArT-seq标记的遗传连锁图的构建和茶叶产量的QTL鉴定

Construction of a DArT-seq marker–based genetic linkage map and identification of QTLs for yield in ...
CNS图表复现04—单细胞聚类分群的resolution参数问题

回顾我们的CNS图表复现之旅已经开始,前面3讲是: CNS图表复现01-读入csv文件的表达矩阵构建Seurat对象 CNS图表复现02-Seurat标准流程之聚类分群 CNS图表复现03-单细胞区 ...
CNS图表复现08—肿瘤单细胞数据第一次分群通用规则

正文文章的第一次分群按照 : immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), stromal (CD10+,MME,fibo or C ...
CNS图表复现20—第三次分群，以T细胞为例

前面我们展现了 CNS图表复现08-肿瘤单细胞数据第一次分群通用规则,然后呢,第二次分群的上皮细胞可以细分恶性与否,免疫细胞呢,细分可以成为: B细胞,T细胞,巨噬细胞,树突细胞等等.实际上每个免疫细 ...
重建交流群，欢迎加入，携手征战股市！

斗指东南,维为立夏,春去夏来.五一长假期间,收到很多股友的问候,笔者这里道一声感谢! 今日就简单回顾一下文章中对医美题材的分析,回到历史文章的当下,在看一下后期表现,笔者文章从挖掘医美板块布局,到退出 ...
混混网络笔记：送礼人情世故交流群（006-011）

006 儿子开学了,我给儿子的老师包了个1000元的红包,老师婉拒:放心好了,对于孩子我能使多大劲儿,我就使多大劲儿.我硬给,老师接了. 我已经不是小孩子了,什么是真话,什么是客套话,以前我听不出来, ...
哪里有好的交流群？

昨天还在感叹,陈秋明的群也解散了,这才一天啊,那个神燕就憋不住了,想聊天,没有地方去,跑来说了一堆. 找QQ群聊天,很难吗?这年头,各种群,不是多如牛毛么? 再说了,俺是有公众号的人啊,到处去找,干嘛 ...
虚拟项目&知识变现交流群开放了（限时入群）

经常有很多粉丝问我,现在有什么好赚钱的项目,我一般都是推荐他们做虚拟项目. 这些年虽然做过不少项目,但大多是做了没多久赚一波钱就走的,没啥积累,而虚拟项目不仅让我持续的赚钱,而且从18年底离职到现在, ...
【全国婚姻家庭帮助交流群】【百年静安】红与黑,万航渡(之一)

静安寺,百年风云际会. 发端于静安寺的万航渡路曲曲折折.宽宽窄窄,行走其中,浮光掠影之间,中国近现代史的一张张老照片依稀可见. 万航渡路,跨静安区和长宁区,南起愚园路,北至曹家渡折向西,最终与长宁路相 ...
袁毅明：关于英语兴趣班培训项目交流群！

昨晚,林哥老师,华特少儿英语培训教育国际班的陈主任打电话过来. 说林哥5月份高级班英语要毕业班,可以开始准备6月份的国际班升班了. 国际班的特点: 1.教材采用美国地道英语教材学习;2.重视对学生逻辑 ...