【R分享|提示】 新手踩过的坑,你踩过几个?(上)

尽管R语言不是一门纯编程语言,但是仍给新手带来无数的困难和痛苦。特别是,当你在run一份code,发现每行code都会出现error,更是无奈。然而,在学习R语言的过程中,这些报错对于小白们来说又是不可避免的。刚开始学习R语言的时候,我也遇到了各种各样的报错,确实让我很崩溃。那么如何在程序报错后快速找到原因呢?我发现常见的报错都是规律可循的,这里我给大家总结了一些初学者容易踩的坑,以及如何copy with它们,以Rstudio为例。

1)Cannot find XX.csx/txt/xlsx等等,这是新手常见的报错--工作路径问题。在出现这类报错时,第一反应看看自己在导入/读取文件前是否设置了所要读取文件的工作路径。在本例子中,我有两种情况需要注意。一是,在读取文件前没有设置工作路径,解决办法:补充该工作路径所在路径,用setwd()设置;二是,设置了工作路径,但是当前工作路径不是该文件所在的工作路径,解决办法:更改工作路径,先用getwd()检查当前的工作路径,再用setwd()进行修改。
## 第一种情况
library("openxlsx")
library("xlsxjars")
library("rJava")
library("xlsx")
mydata <- read.xlsx("1.xlsx",1)
## 报错信息如下
Error in loadWorkbook(file, password = password) : Cannot find 1.xlsx
## 解决办法
setwd ( ) ## 这是设置所需读取文件的工作路径的函数

## 第二种情况
setwd (XXXX)
mydata <- read.xlsx("1.xlsx",1)mydata <-read.xlsx("1.xlsx",1)
## 报错信息与第一种情况一样
## 解决办法
getwd ( ) ## 这是检查当前工作路径的函数
setwd ( )

个人建议:我不太推荐每次在读取前用setwd()来设置工作路径,因为这样得保证每次所用数据都必须在同一个工作路径才可以,否则都需要改。然而,通常我们的数据都是根据个人情况分别放在不同的文件夹,即工作路径都不同。因此,每次读取文件前,我在这里推荐大家用这个方法选择工作路径(choose directory)以解决我提到的问题:

2)Could not find function "XXX"等等,这个报错是属于程序包没有加载的问题。因此,我们在使用某个函数时,首先要清楚知道该函数属于哪个程序包里的,并先用library()读取该程序包,然后再运行该函数即可。

mydata <- read.xlsx("1.xlsx",1)
## 报错信息如下
Error in read.xlsx("1.xlsx", 1) : could not find function "read.xlsx"
### 解决办法
library(openxlsx)
library("xlsxjars")
library("rJava")
library("xlsx")
mydata <- read.xlsx("1.xlsx",1)mydata <-read.xlsx("1.xlsx",1)

如果不清楚该函数是哪个程序包,我们可以用?"read.xlsx"或 help("xx")来咨询,咨询结果如下:红色框即为所需要的程序包,需要注意的是在咨询的时候必须要加上引号" "。

3)unexpected input in 'XXX', 这类错误是初学者常遇到的--中英文标点符号问题。新手在出现这类报错时,第一反应看报错的位置in 后面停在哪里。在下面例子中,句子停在了Species,"之后,通过仔细查看代码,能够发现句子中报错的位置是一个中文格式的逗号。因此,把中文格式的逗号改成英文格式即可,这种报错只要在R语言练习一段时间后就基本不会再烦了。

## 这类错误需要检查中英文标点符号
library(ggplot2)
library(datasets)
data(package="datasets") ## 查看该程序包里含有哪些数据集
data (iris)
head (iris)
a <- data.frame(iris$Species ,iris$Sepal.Width)
## 报错信息如下
Error: unexpected input in "a <- data.frame(iris$Species ,?"
## 解决办法
## 将中文的标点符号改成英文模式下的即可
a <- data.frame(iris$Species, iris$Sepal.Width)

个人建议:由于rstudio刚开始使用时用的是默认的背景模板,为了在学习过程中节省一些时间,提高代码的准确率,可以用下面方法更换一下背景模板,选择一种最适合自己的模板,减少不必要的错误。

4)unexpected input in "setwd(I:\",这里我们发现与第三类错误显示同样报错。但是我们要清楚在R语言中引用地址的时候,需要注意是'/'还是'\\',如果在地址引用时,用了'//'或'\'就会报错。下面我们用例子来展示,我们发现我们在设置路径时,符号用错了,直接报错。在读取数据时,工作路径的符号也用错了,出现了同样的报错。这里,我们只需要熟记一点,在R语言中要用'/' or '\\'即可。

## 这类报错也属于符号使用错误
setwd("I:\R language\R语言郑师兄代码")
## 报错信息如下
Error: unexpected input in "setwd(I:\"
## 解决办法
## 把'\'改成 '/' or '\\'
setwd("I:\\R language\\R语言郑师兄代码")
setwd("I:/R language/R语言郑师兄代码")

## 同样是工作路径的情况
library("xlsxjars")
library("rJava")
library("xlsx")
library(openxlsx)
mydata <- read.xlsx("I:\R language\R语言郑师兄代码\图一.xlsx",2)
## 报错信息如下
Error: '\R' is an unrecognized escape in character string starting ""I:\R" 
## 解决方法 与上述相同
mydata <- read.xlsx("I:\\R language\\R语言郑师兄代码\\图一.xlsx",2)

报错结果:

更正展示:

5)unexpected symbol in: "XXX",这类报错是比较常见且简单的,与第三种错误类似,属于缺少or多余符号。这类错误出现时,应该第一时间查看error中出现报错的位置,出现问题的地方在两个报错的两个双引号" "之间,因此应该出现在第一行和第二行代码之间。下面的例子中,我们发现缺少了括号,因此我们在代码的最后把括号补充上后,问题就解决了。

## 这类报错属于多余或缺少符号
library(ggplot2)
library(datasets)
data(package="datasets") ## 查看该程序包里含有哪些数据集
data(iris)
head(iris)
a <- data.frame(iris$Species,iris$Sepal.Width)
mydata <- iris
mydata <- as.data.frame(t(dat[,as.character(a$Species)])
mydata
## 报错信息如下
Error: unexpected symbol in: 
"mydata < as.data.frame(t(dat[,as.character(a$Species)])
mydata"
## 解决办法
## 只需要删除多余和补充缺少的符号即可

个人建议:如果在输入有括号的代码时,可以把鼠标在每个右半边的括号点一下,rstudio会自带提醒这一组括号是否完成输入:当前括号表示是第二个左半边括号,因此需要在最右边再补充一个括号。
6)unexpected symbol in "1r",尽管这类报错和第五类显示同种错误,但是不是完全一样。这类错误也是新手会犯的,但这类错误很简单,我们在定义目标变量的时候,不能用数字作为定义名。这里我提供一个思路去理解,如果可以用数字打头,也需要加上字母:例如1+UUU; 1+AALL。然而这些不能作为变量名,因为编译器不能区分究竟是数字还是变量名。利用数字和字母一起显然没有只用字母来的简便,索性就去掉了。因此,我们需要记住的是,在定义目标变量名称的时候不能用数字打头。

## 数字打头不能做变量名的错误
1r <- iris$Species
## 报错信息如下
Error: unexpected symbol in "1r"
## 解决办法
## 把数字去掉,只用字母作为变量名
r <- iris$Species

7)object 'xxx' not found,这类报错比较直观,就是如错误所描述的:找不到目标的问题。在下面例子中,就是报错信息中的a找不到。通常可能是你自己在运行代码时候,run 的太快了,上一行的数据读取信息还没读,就紧接着跑下一行代码,所以会出现第二行代码报错,没有找到a这个变量。以后出现这类错误时,只需要查看一下自己环境变量是否缺少该目标变量,如果缺少了补充上就可以了。

## 这类错误检查环境变量中是否存在所需目标
library(ggplot2)
library(datasets)
data(package="datasets") ## 查看该程序包里含有哪些数据集
data(iris)
head(iris)
b <- a[-1]
## 报错信息如下
Error: object 'a' not found
## 解决办法
## 补充目标变量即可
a <- data.frame(iris$Species,iris$Sepal.Width)
b <- a[-1]

个人建议:在报错时,先检查下环境变量中的变量,是否能找到所需要的目标。如果没有的话,把目标变量读取后再运行报错的代码即可。

TBC...

(0)

相关推荐