dplyr学习(1)

先写点无关紧要的:

本来想用Rmarkdown,毕竟可以输出每步结果。但是Rmarkdown生成的html格式比word更方便阅读。后来想想算了,就用最简单的吧。

笔记开始:

先记录一下:select、filter、和slice

(1)select提取列

library(ggplot2) #get diamonds datalibrary(magrittr)library(dplyr)
#根据列名提取列select(diamonds, carat, price) #如果用R基本的数据框操作也是可以的。diamonds[,c("carat", "price")]
#现在比较流行管道符,diamonds %>% select(carat, price)diamonds %>% select(c(carat, price))diamonds %>% select(one_of('carat', 'price'))#这三种方法得到的结果是一样
#向量theCols <- c('carat', 'price')diamonds %>% select(one_of(theCols))
#用列的号码也是可以的select(diamonds, 1, 7) diamonds %>% select(1, 7)
diamonds %>% select(starts_with('c'))diamonds %>% select(ends_with('e'))diamonds %>% select(contains('1'))
#正则表达式diamonds %>% select(matches('r.+t'))
#去掉某列,只需要加负号,如diamonds %>% select(-starts_with('c'))


(2)filter 提取特定行

#cut列的值为Ideal的行diamonds %>% filter(cut == 'Ideal')diamonds %>% filter_("cut == 'Ideal'")
diamonds %>% filter(cut %in% c('Ideal', 'Good'))diamonds %>% filter(price >= 1000)diamonds %>% filter(price != 1000)
diamonds %>% filter(carat > 2, price > 1000)diamonds %>% filter(carat > 2 & price > 1000)
diamonds %>% filter(carat > 2 | price > 1000)#列名及其值都作为变量theCol <- 'cut'theCut <- 'Ideal'diamonds %>% filter_(sprintf("%s == '%s'", theCol, theCut))

(3)slice 通过行号选择行

diamonds %>% slice(1:5)diamonds %>% slice(1:5, 8, 15:20)
diamonds %>% slice(-5) #显示除了第5行之外的行

先记录一下这三个函数的用法吧,接下来是mutate、summarize、和group_by。

(0)

相关推荐

  • R数据框:按列索引按列名称删除指定的列数据

    读取数据集后,发现某些数据并不需要,如果想让数据看着简单些,可以考虑删除某些指定的列 数据源 雇员数据employee 本号后台回复[雇员]下载数据,欢迎读者朋友自行实践. 按索引号删除某列 bdat ...

  • R语言 | 数据操作dplyr包

    [更新~] Python网络爬虫与文本数据分析 dplyr简介 dplyr是R语言的数据分析包,很像python中的pandas,能对dataframe类型的数据做很方便的数据处理和分析操作.最初我也 ...

  • dplyr总结篇

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. dplyr-总结  有必要对dplyr进行一个总结 对行处理 数据处理对于 ...

  • R语言的繁荣背后何尝没有隐患

    R语言的繁荣是毋庸置疑的,至少在科研界的地位蒸蒸日上,极大的占领了原来属于各种商业绘图软件的市场.不仅仅是在于其免费的属性,更重要的是随心所欲地自由定制. 但是参与的玩家多了之后,也会出现一些冲突.最 ...

  • dplyr函数

    主要包含两个变量: select()#选取某一列 mutate()#添加一列 配合select()进行使用的函数: starts_with()         ends_with()          ...

  • 《R数据科学》第3章——dplyr是什么

    写在前面 dplyr是R语言中为数不多的,也是最好用的数据清洗R包,这也是hendly团队的核心产品,承载着在数据到绘图或者分析过程的桥梁.其中包含的函数超过100条,值得我们花费很长的时间一步步学习 ...

  • R学习 从Tidyverse学起,入门R语言(tibble,readr和dplyr)

    R学习往期回顾: R学习:字符串 R学习:环境和函数 R学习:数据框的基本操作 R学习:R for Data Science(五) R学习:R for Data Science(四) R学习:R fo ...

  • R学习 从Tidyverse学起,入门R语言dplyr合并数据

    R学习往期回顾: R学习 流程控制 if,else,ifelse R学习 从Tidyverse学起,入门R语言(tidyr和stringr) R学习 从Tidyverse学起,入门R语言(tibble ...

  • S50学习资料讲解

    S50学习资料讲解

  • “取类比象”——学习中医的秘法

    万物皆有"象",按同象同类的原则,由一般到个别,从已知推导未知,以类万物,中国古代圣贤即是以这种演绎方法来认识世界,建立了整个传统文化体系.中医是传统文化中的瑰宝,中医学中亦有&q ...

  • 整理明朝山水画100幅供大家学习收藏

    整理明朝山水画100幅供大家学习收藏

  • 初中数学19类最值问题全覆盖,收藏学习!

    春熙初中数学 25篇原创内容 公众号 初中数学解题思路 本号致力于初中数学学习的钻研和探索.全面覆盖初中数学典型题集.解题模型.动点最值.思路方法.超级易错.几何辅助线.压轴破解等方面,欢迎关注! 1 ...

  • 一则公报案例学习笔记:对修改股东出资期限应否适用资本多数决规则的思考|审判研究

    一.问题的提出 2021年第3期<最高人民法院公报案例>刊登了鸿大(上海)投资管理有限公司与姚锦城公司决议纠纷上诉案,裁判要旨为:"公司股东滥用控股地位,以多数决方式通过修改出资 ...

  • “经方就是好”、“高手在民间”,是中医学习之道

    导读:提到中医的最大优势及特点,很多朋友首先想的是辨证论治,并把其奉为中医的瑰宝.然而事实是这样的,现在很多人倍加推崇的辨证论治,并不是真正的辨证论治,而是一种畸形的中医发展模式,因为目前的辨证论治, ...

  • 孩子学习不积极没动力, 家长要时刻注意, 可能是缺乏“内驱力”

    我们都知道兴趣是孩子最好的老师,孩子在兴趣状态下,非常愿意学习,不用家长催促,孩子就有足够的内驱力,并且孩子也不觉得学习是一件枯燥的事情.所以想要让孩子不再被家长催促着学习,要帮助孩子找到内驱力. 只 ...