4年前的TCGA重磅资料你学了吗
其中有一件事值得回忆一下,也想借此机会组建新的学习小组开启新的TCGA数据库挖掘之旅,学习小组在文末!
忆苦思甜
不过,忆苦思甜嘛,当初涨粉最多的就是:标准TCGA大文章需要哪些数据?[赠重磅资料] 在公众号粉丝数量不足一千的时候,居然取得了阅读量近万的佳绩!
当时写的是https://tcga-data.nci.nih.gov/docs/publications/ (本人已经写爬虫把所有TCGA在CNS的大文章的PDF及附件全部下载,请后台回复TCGA大文章获取!) 实际上呢,这个关键词现在仍然是有效的哦!
还有TCGA历年研讨会的全部资料!
https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/publications
全部文章都给到大家了,就是不知道大家学习的效果如何?有没有通过解读TCGA系列文章来获得生物信息学数据处理的认知呢?
关于TCGA数据库
众所周知,TCGA数据库是目前最综合最全面的癌症病人相关组学数据库,包括:
DNA Sequencing
miRNA Sequencing
Protein Expression array
mRNA Sequencing
Total RNA Sequencing
Array-based Expression
DNA Methylation
Copy Number array
知名的肿瘤研究机构都有着自己的TCGA数据库探索工具,比如:
Broad Institute FireBrowse portal, The Broad Institute
cBioPortal for Cancer Genomics, Memorial Sloan-Kettering Cancer Center
所以我挑选了部分,写了6个数据下载系列教程:
TCGA的28篇教程- 使用R语言的cgdsr包获取TCGA数据(cBioPortal)
TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据(FireBrowse portal)
TCGA的28篇教程- 批量下载TCGA所有数据 ( UCSC的 XENA)
虽然说,教程是关于TCGA数据库的不同数据的下载,实际上是希望可以帮助大家认识TCGA数据库的全貌,然后根据大家的提问,我也扩充了部分常见的TCGA数据库用法:
还有泛癌系列解读
如果这些资料你都没有看也没有学,那么你可能需要~~~
新的学习小组
其实是年初我举行的肿瘤认知升级训练营,但是当初筛选标准太严格,而且确实没有让我眼前一亮的值得大力培养的后辈出现,所以就搁置了。
当时还设置了5个考核任务,希望调动大家主动学习的积极性,可是并没有设置好的跟踪反馈检查机制,让我这样的大忙人来搞这么具体的事情实在是太难了!
但是肿瘤学研究,确实离不开TCGA数据库的认知,我还是希望更多的人参与学习!所以仍然是发布学习小组通知啦!
报名须知
学习内容: 共享一些TCGA相关文献和教程资料,督促大家从基础学起!