实习生(生物信息学知识体系的建立)招募
生信基础知识掌握
生物芯片和测序技术的分类,原理及历史,需要自行查找归纳总结
按照公司来区分:affymetrix,agilent和illumina,还有罗氏
按照应用来区分,表达芯片,基因分型芯片,拷贝数芯片
其它定制化芯片
1.5.1 Illumina
1.5.2 SOLID
1.5.3 Roche 454
1.5.4 lon Torrent
1.5.5 Pacific Biosciences
1.5.6 纳米孔技术
主要的测序平台
主要的芯片平台
3大国际数据中心的了解,NCBI,ENSEMBL,UCSC
https://www.ebi.ac.uk/ena
https://www.ebi.ac.uk/arrayexpress/
https://www.ncbi.nlm.nih.gov/geo/
https://www.ncbi.nlm.nih.gov/sra
了解每个数据中心的子数据库单元
了解数据上传的4个地方,NCBI的GEO和SRA, EBI的ENA和arrayexpress
数据格式的整理和熟记,包括fastq,fasta,sam,bam,vcf,gff,gtf,bed,MAF
http://www.biotrainee.com/thread-42-1-1.html
参考基因组的熟悉及其基因组注释新文件下载及摸索
从基因开始理解生物信息学
GF生长因子及其受体家族系列
人体基因数量,分类,基因结构等等
genecard数据库
熟记部分基因
组学技术应用的第一篇文章以及最新综述文章收集整理
各个组学数据分析的结题报告的阅读及整理
数据库的收集整理,包括
http://snpeff.sourceforge.net/download.html
http://annovar.openbioinformatics.org/en/latest/user-guide/download/
https://asia.ensembl.org/info/docs/tools/vep/script/vep_cache.html
遗传变异资源
TCGA
ENCODE
GTEx
基因集注释数据库:GO terms/Pathway (KEGG, BIOCARTA,Reactome) MSigDB,主要理解基因集的定义