实习生(生物信息学知识体系的建立)招募

生信基础知识掌握

  • 生物芯片和测序技术的分类,原理及历史,需要自行查找归纳总结

    • 按照公司来区分:affymetrix,agilent和illumina,还有罗氏

    • 按照应用来区分,表达芯片,基因分型芯片,拷贝数芯片

    • 其它定制化芯片

      • 1.5.1 Illumina

      • 1.5.2 SOLID

      • 1.5.3 Roche 454

      • 1.5.4 lon Torrent

      • 1.5.5 Pacific Biosciences

      • 1.5.6 纳米孔技术

    • 主要的测序平台

    • 主要的芯片平台

  • 3大国际数据中心的了解,NCBI,ENSEMBL,UCSC

    • https://www.ebi.ac.uk/ena

    • https://www.ebi.ac.uk/arrayexpress/

    • https://www.ncbi.nlm.nih.gov/geo/

    • https://www.ncbi.nlm.nih.gov/sra

    • 了解每个数据中心的子数据库单元

    • 了解数据上传的4个地方,NCBI的GEO和SRA, EBI的ENA和arrayexpress

  • 数据格式的整理和熟记,包括fastq,fasta,sam,bam,vcf,gff,gtf,bed,MAF

    • http://www.biotrainee.com/thread-42-1-1.html

  • 参考基因组的熟悉及其基因组注释新文件下载及摸索

  • 从基因开始理解生物信息学

    • GF生长因子及其受体家族系列

    • 人体基因数量,分类,基因结构等等

    • genecard数据库

    • 熟记部分基因

  • 组学技术应用的第一篇文章以及最新综述文章收集整理

  • 各个组学数据分析的结题报告的阅读及整理

  • 数据库的收集整理,包括

    • http://snpeff.sourceforge.net/download.html

    • http://annovar.openbioinformatics.org/en/latest/user-guide/download/

    • https://asia.ensembl.org/info/docs/tools/vep/script/vep_cache.html

    • 遗传变异资源

      • TCGA

      • ENCODE

      • GTEx

    • 基因集注释数据库:GO terms/Pathway (KEGG, BIOCARTA,Reactome)  MSigDB,主要理解基因集的定义

(0)

相关推荐