生信编程直播第0题-生信编程很简单!

貌似顺序有点怪异,我们都把1~8题给讲解完了,现在才开始第0题,很明显,这个是临时加入的,因为有很多没有编程基础的朋友也开始跟着我们学习了。

还不知道怎么回事的先查看历史题目:

生物信息学技能面试题(第1题)-人类基因组的外显子区域到底有多长

生物信息学技能面试题(第2题)-探索人类基因组序列

生物信息学技能面试题(第3题)-探索人类基因组注释文件

生物信息学技能面试题(第4题)-多个同样的行列式文件合并起来

生物信息学技能面试题(第5题)-根据GTF画基因的多个转录本结构

生物信息学技能面试题(第6题)-下载最新版的KEGG信息,并且解析好

生信编程直播第七题:写超几何分布检验!

生信编程直播第八题:ID转换大全

本次的第0题是真真正正的适合0基础朋友学习的,请珍惜!

首先安装bowtie2这个软件,里面有测试数据!

  • ## Download and install bowtie

  • cd ~/biosoft

  • mkdir bowtie &&  cd bowtie

  • wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip

  • unzip bowtie2-2.2.9-linux-x86_64.zip

针对测试数据:

对FASTQ的操作

  • 5,3段截掉几个碱基

  • 序列长度分布统计

  • FASTQ 转换成 FASTA

  • 统计碱基个数及GC%

对FASTA的操作

  • 取互补序列

  • 取反向序列

  • DNA to RNA

  • 大小写字母形式输出

  • 每行指定长度输出序列

  • 按照序列长度/名字排序

  • 提取指定ID的序列

  • 随机抽取序列

高级难度:

  • 根据坐标取序列

  • 多文件合并

  • 根据ID列表取序列

  • GTF文件探索

  • 简并碱基的引物序列还原成多条序列

  • snp进行注释并格式化输出

第0题会录制3次视频~

(0)

相关推荐