####数据框的整理####

2024-08-03 17:01:49

##首先使用R语言基本函数进行处理，这里使用我们自己的数据做一个演示；

setwd("E:/Shared_Folder/HG_usearch_HG")

# 读入实验设计和Alpha多样性值

design = read.table("map_lxdjhg.txt",header=T, row.names= 1, sep="\t")

alpha =read.table("alpha8825.txt", header=T, row.names= 1,sep="\t")

下面开始整理数据

cbind函数是最基础的横向合并数据框的函数，这样由于没有指定索引列，必须保证两个数据框列名完全一样，并且排列顺序也完全一致，这里我很少采用这种方法。

index=cbind(alpha, design)

##因此，我们使用merge函数，由于我们导入数据均设置了第一列为列名，而且我们知道列名是一样的；

#all=F参数是根据列名匹配上的并入，没有匹配上的丢弃

index = merge(alpha,design,by="row.names",all=F)

#对于我们而言，design文件并不是全部都是我们想要的，因此我们选择了一部分

design1<-design[1:6,]

#这里以design文件为索引，选择多样性指标，all.x中的x就是指第一个数据框

index = merge(design1,alpha,by="row.names",all=F,all.x=TRUE)

#######附：：：：这里我们的数据不是这种形式的

#仅仅包含两个数据框，这种会根据两个数据框中所有的相同列（根据列名选择），选择全部列共有的元素；

merge(design1,alpha)

#如果两个数据库框中还有超过两列相同的列，但是按照其中一列进行合并，则剩下的相同的列则会分为x（前一个数据框），y（后一个数据框）分别显示各自的列；

merge(design1,alpha,by="row.names")

#####

###提取我们不需要的变量

index$LinkerPrimerSequence <- NULL

index$BarcodeSequence<- NULL

#当然还有其他方法,更据列名选择要去掉的列名

wt<-names(index) %in%c("Description")

#!表示非的意思，将逻辑值反转

index<-index[!wt]

###当然，如果我们不加上“！”，就是选择这个列留下，具体使用根据自己想留下的多还是想去除的多；

#下面我们进行选择需要的观测

#根据我们的实验我们选择GF1和GC1这两组的观测,同时我们只选择一下三列足够做alpha多样性

index1<-subset(index,SampleType=="GF1"|SampleType=="GC1",select =c("SampleType","shannon","chao1"))、

微生信生物

学习永无止境，分享永不停息！

一个python读取cvs文件并处理画图的程序

import csv from matplotlib import pyplot as plt from datetime import datetime #读取CSV文件数据 filename='s ...
如何利用ROW函数添加序号及自动排列序号

当我们在 Excel 表格中填充数据的时候,下拉单元格填充框就会依次递增,但有用户提出疑问,当我们删除其中某一行时,序号并不会自动根据之前的顺序进行排序,那这种问题该如何解决呢,今天我们就来教大家,利 ...
多列去重排列，这个方法你一定要学会！

送人玫瑰,手有余香,请将文章分享给更多朋友动手操作是熟练掌握EXCEL的最快捷途径! 今天和大家分享一则不相邻多列去重的问题. 表格的左侧是若干个业务员的业绩,要求统计出每一个业务员的总业绩. 思考 ...
【R分享|实战】科白君教你定义函数批量计算微生物α多样性

" 突破." --科白君 "R分享实战"专刊·第9篇编辑 | 科白维尼 500字 | 10分钟阅读本期推送内容最近在处理一批数据量较大的数据, ...
浅析R语言单因素方差分析中的多重比较

浅析单因素方差分析中的多重比较本脚本侧重于单因素方差分析中多重比较方法的运用; 就不展示数据正态性及齐次性的运算了(默认都符合,一般理化数据是都符合的); 有的人喜欢用Tukey检验,但会遇到一些不 ...
R学习：数据框的基本操作

R学习往期回顾 R学习:R for Data Science(一) R学习:R for Data Science(二) R学习:R for Data Science(三) R学习:R for Data ...
【收藏】一组在范围内查找数据的超级简单函数，职场必备

小伙伴们大家晚上好,今天给大家介绍一组函数,用于解决查找方面问题的神器函数. 下面是A表原始数据图片: 现在领导提供了新的B表,新的B表只有部分楼号,要求取姓名进行特别处理: 这种类型的数据,是将本来 ...
轻松将竖排数据按分组整理成横排！（动画）

- 问题 - 将左表整理成右表的样子其中"其他"列里的个数不确定 - 解法 - 这个问题的解法其实并不复杂,但需要对分组的操作及其原理.基础函数的应用以及透视等内容比较熟悉,具体 ...
R数据框：按列索引按列名称删除指定的列数据

读取数据集后,发现某些数据并不需要,如果想让数据看着简单些,可以考虑删除某些指定的列数据源雇员数据employee 本号后台回复[雇员]下载数据,欢迎读者朋友自行实践. 按索引号删除某列 bdat ...
如何修改R数据框的列名称？

现在我们预览一下[犯罪数据], 有两个列的名称,也就是两个变量名称中间含有空格,这在未来的统计分析中容易造成一些不必要的操作错误. 另外,变量名称也不宜太长,建议用英文缩写来表示,短英文字符是最好的. ...
Pandas将列表（List）转换为数据框（Dataframe）

这篇文章主要介绍了Pandas将列表(List)转换为数据框(Dataframe),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 ...
初中数学精讲（第30期）数据的收集整理与描述

各位同学.朋友们大家好: 今天我们继续初中数学数据的统计:我们来训练因式分解,提升自己的解题能力. 花时间弄懂下面的基础知识: 一.选择题(每题5分,共20分) 7．[2019·河北]某同学要 ...
学徒讨论-在数据框里面使用每列的平均值替换NA

最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值.但是问题的提出者自己的代码是错的,如下: 他认为替换不干净,应该是循环有问题.希望我们帮忙检查,我通常是懒得看其他人写的代码, ...
按照列筛选数据框不容易那么按照行就容易吗

前面我出过一个考题,是对GEO数据集的样本临床信息,根据列进行筛选,比如: rm(list=ls()) options(stringsAsFactors = F) library(GEOquery) ...
R语言里面双层list变成长形数据框

绘图需求最大的难关往往是数据整理,比如下面的双层list : set.seed(123456) gs=list(tmp1=list(g1=sample(1000,abs(floor(100*rnorm ...
对表型数据框进行去冗余

上次GEO课程回答了学员问题:使用R语言在向量的任何位置插入任何元素实力演示了如何自定义函数,这样大家就可以无限制创造方法来解决自己特殊的需求,课后一个月的答疑期,发现大家还是有各式各样的问题,比如 ...

####数据框的整理####

相关推荐