####数据框的整理####

##首先使用R语言基本函数进行处理,这里使用我们自己的数据做一个演示;

setwd("E:/Shared_Folder/HG_usearch_HG")

# 读入实验设计和Alpha多样性值

design = read.table("map_lxdjhg.txt",header=T, row.names= 1, sep="\t")

alpha =read.table("alpha8825.txt", header=T, row.names= 1,sep="\t")

下面开始整理数据

cbind函数是最基础的横向合并数据框的函数,这样由于没有指定索引列,必须保证两个数据框列名完全一样,并且排列顺序也完全一致,这里我很少采用这种方法。

##

index=cbind(alpha, design)

##因此,我们使用merge函数,由于我们导入数据均设置了第一列为列名,而且我们知道列名是一样的;

#all=F参数是根据列名匹配上的并入,没有匹配上的丢弃

index = merge(alpha,design,by="row.names",all=F)

#对于我们而言,design文件并不是全部都是我们想要的,因此我们选择了一部分

design1<-design[1:6,]

#这里以design文件为索引,选择多样性指标,all.x中的x就是指第一个数据框

index = merge(design1,alpha,by="row.names",all=F,all.x=TRUE)

#######附::::这里我们的数据不是这种形式的

#仅仅包含两个数据框,这种会根据两个数据框中所有的相同列(根据列名选择),选择全部列共有的元素;

merge(design1,alpha)

#如果两个数据库框中还有超过两列相同的列,但是按照其中一列进行合并,则剩下的相同的列则会分为x(前一个数据框),y(后一个数据框)分别显示各自的列;

merge(design1,alpha,by="row.names")

#####

###提取我们不需要的变量

index$LinkerPrimerSequence <- NULL

index$BarcodeSequence<- NULL

#当然还有其他方法,更据列名选择要去掉的列名

wt<-names(index) %in%c("Description")

#!表示非的意思,将逻辑值反转

index<-index[!wt]

###当然,如果我们不加上“!”,就是选择这个列留下,具体使用根据自己想留下的多还是想去除的多;

#

#

#

#下面我们进行选择需要的观测

#根据我们的实验我们选择GF1和GC1这两组的观测,同时我们只选择一下三列足够做alpha多样性

index1<-subset(index,SampleType=="GF1"|SampleType=="GC1",select =c("SampleType","shannon","chao1"))、

微生信生物

学习永无止境,分享永不停息!

(0)

相关推荐

  • R学习:数据框的基本操作

    R学习往期回顾 R学习:R for Data Science(一) R学习:R for Data Science(二) R学习:R for Data Science(三) R学习:R for Data ...

  • 【R分享|实战】科白君教你定义函数批量计算微生物α多样性

    " 突破."   --科白君 "R分享实战"专刊·第9篇   编辑 | 科白维尼   500字 | 10分钟阅读 本期推送内容 最近在处理一批数据量较大的数据, ...

  • 如何利用ROW函数添加序号及自动排列序号

    当我们在 Excel 表格中填充数据的时候,下拉单元格填充框就会依次递增,但有用户提出疑问,当我们删除其中某一行时,序号并不会自动根据之前的顺序进行排序,那这种问题该如何解决呢,今天我们就来教大家,利 ...

  • 【收藏】一组在范围内查找数据的超级简单函数,职场必备

    小伙伴们大家晚上好,今天给大家介绍一组函数,用于解决查找方面问题的神器函数. 下面是A表原始数据图片: 现在领导提供了新的B表,新的B表只有部分楼号,要求取姓名进行特别处理: 这种类型的数据,是将本来 ...

  • 浅析R语言单因素方差分析中的多重比较

    浅析单因素方差分析中的多重比较 本脚本侧重于单因素方差分析中多重比较方法的运用; 就不展示数据正态性及齐次性的运算了(默认都符合,一般理化数据是都符合的); 有的人喜欢用Tukey检验,但会遇到一些不 ...

  • 多列去重排列,这个方法你一定要学会!

    送人玫瑰,手有余香,请将文章分享给更多朋友 动手操作是熟练掌握EXCEL的最快捷途径! 今天和大家分享一则不相邻多列去重的问题. 表格的左侧是若干个业务员的业绩,要求统计出每一个业务员的总业绩. 思考 ...

  •  一个python读取cvs文件并处理画图的程序

    import csv from matplotlib import pyplot as plt from datetime import datetime #读取CSV文件数据 filename='s ...

  • 轻松将竖排数据按分组整理成横排!(动画)

    - 问题 - 将左表整理成右表的样子 其中"其他"列里的个数不确定 - 解法 - 这个问题的解法其实并不复杂,但需要对分组的操作及其原理.基础函数的应用以及透视等内容比较熟悉,具体 ...

  • R数据框:按列索引按列名称删除指定的列数据

    读取数据集后,发现某些数据并不需要,如果想让数据看着简单些,可以考虑删除某些指定的列 数据源 雇员数据employee 本号后台回复[雇员]下载数据,欢迎读者朋友自行实践. 按索引号删除某列 bdat ...

  • 如何修改R数据框的列名称?

    现在我们预览一下[犯罪数据], 有两个列的名称,也就是两个变量名称中间含有空格,这在未来的统计分析中容易造成一些不必要的操作错误. 另外,变量名称也不宜太长,建议用英文缩写来表示,短英文字符是最好的. ...

  • Pandas将列表(List)转换为数据框(Dataframe)

    这篇文章主要介绍了Pandas将列表(List)转换为数据框(Dataframe),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 ...

  • 初中数学精讲(第30期)数据的收集整理与描述

      各位同学.朋友们大家好:   今天我们继续初中数学数据的统计:我们来训练因式分解,提升自己的解题能力. 花时间弄懂下面的基础知识: 一.选择题(每题5分,共20分) 7.[2019·河北]某同学要 ...

  • 学徒讨论-在数据框里面使用每列的平均值替换NA

    最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值.但是问题的提出者自己的代码是错的,如下: 他认为替换不干净,应该是循环有问题.希望我们帮忙检查,我通常是懒得看其他人写的代码, ...

  • 按照列筛选数据框不容易那么按照行就容易吗

    前面我出过一个考题,是对GEO数据集的样本临床信息,根据列进行筛选,比如: rm(list=ls()) options(stringsAsFactors = F) library(GEOquery) ...

  • R语言里面双层list变成长形数据框

    绘图需求最大的难关往往是数据整理,比如下面的双层list : set.seed(123456) gs=list(tmp1=list(g1=sample(1000,abs(floor(100*rnorm ...

  • 对表型数据框进行去冗余

    上次GEO课程回答了学员问题:使用R语言在向量的任何位置插入任何元素 实力演示了如何自定义函数,这样大家就可以无限制创造方法来解决自己特殊的需求,课后一个月的答疑期,发现大家还是有各式各样的问题,比如 ...