R语言中使用read.table函数读取文件数据方法详解

在R中,可以使用read.table()函数从具有多列表格形式的文件中读取数据。使用好它可以简单的从文本文件或CSV这种文件中读取数据。

read.table()函数语法格式

read.table()函数的语法格式:

福特锐界PLUS 豪横实验室

广告

read.table(file, header = FALSE, sep = '', quote = '''', dec = '.', row.names, col.names, as.is = !stringsAsFactors, nrows = -1,skip = 0, blank.lines.skip = TRUE, encoding = 'unknown',skipNul = FALSE)

下面使用下图所示的文件结构进行演示操作:

文件中的部分数据及存储格式

file参数

展开剩余80%

要读取的文件名称,矩形表格数据的每行是文件中的一行,如果file参数中给定的文件名不是绝对路径,则文件名是相对于当前R的工作目录给出的。

read.table('gi.txt')

从文件中读取的结果

从结果可以看出若未给定分隔符sep参数时,read.table函数默认以空白分隔,且文件中的标题行被作为数据处理。同时,read.table函数依次给每列的变量名为v1, v2, ...。结果的第1列为行标题(序号)。

header参数

逻辑值。数据文件中是否有标题行。如果header设置为TRUE,则要求第一行要比数据列的数量少一列。

read.table('gi.txt', header=TRUE)

指定header参数

col.names

指定列名的向量。缺省情况下是又'V'加上列序构成,即V1,V2,V3......

read.table('gi.txt', header=TRUE, col.names=c('year', 'x', 'y'))

指定col.names参数

nrows

整型数。用于指定从文件中读取的最大行数。负数或其它无效值将会被忽略。

指定nrows参数

row.names

保存行名的向量。可以使用此参数以向量的形式给出每行的实际行名。或者要读取的表中包含行名称的列序号或列名字符串。在数据文件中有行头且首行的字段名比数据列少一个的情况下,数据文件中第1列将被视为行名称。除此情况外,在没有给定row.names参数时,读取的行名将会自动编号。可以使用row.names = NULL强制对行进行编号。

使用row.names参数

从图中所示的结果可以看出,默认情况下的序号被替换为指定的Rn形式了,paste0函数是将字符串连接在一起,且连接的字符串结果中间没有分隔符。

skip

整型数。读取数据时忽略的行数。

使用skip参数的情况

从结果可以看出,前10行数据被忽略了。指定skip参数时应该设置col.names参数,否则第一行数据将作为列名处理

sep参数

数据的分隔符。默认sep=''。默认情况下,read.table()函数以空白作为数据的分隔符。若读取CSV文件,则需要指定sep=','。

blank.lines.skip

逻辑值,此参数值设置为TRUE时,数据文件中的空白行将被忽略。默认值为TRUE。

encoding

假定输入字符串的编码方式。

skipNul

逻辑值。是否忽略空值。默认为FALSE。

-------------------------

欢迎关注本号。本号将持续更新有关R语言方面的文章。内容由浅入深,从R语言的基本语法到具体的分析应用。将个人在实际工作中的知识分享给大家。

首赞 +1
平台声明
(0)

相关推荐

  • Python pandas读取Excel文件

    excelperfect 标签:Python与Excel,pandas 要使用Python处理数据,首先要将数据装载到Python,这里使用Python pandas来读取Excel文件. panda ...

  • SUBSTITUTE函数用法全总结

    HI,大家好,我是星光. 今天给大家分享一个函数,叫做SUBSITUTE. SUBSITUTE函数是Excel文本处理中最常使用的函数之一,可以将数据局部的旧值替换为新值,类似于基础操作里的查找与替换 ...

  • 瞬间搞定大量数据!这4个Excel函数太牛了!

    哈喽大家好,我是小可~ 在实际应用中我们经常会用到数据粘贴,数据导入等大量数据的处理. 在这些过程中我们经常会遇到数据中包含不确定的空格.换行,导致在做数据匹配.引用.查找时出现错误. 今天小可带来四 ...

  • 按分隔符将字符串中的数据分列放置

    原创作者 | 李锐 微信公众号 | Excel函数与公式(ID:ExcelLiRui) 个人微信号 | (ID:ExcelLiRui520) 按分隔符将字符串中的数据分列放置 今天我来结合一个实际案例 ...

  • 第26天:Python os 模块详解

    第26天:Python os 模块详解

  • Perl 命令行

    https://blog.csdn.net/alivio/article/details/6898254 perl - Practical Extraction and Report Language ...

  • R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据

    原文链接:http://tecdat.cn/?p=20828 本文使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化,特别是_最小_最_大凹_度_惩罚_函数_(MCP)_和光滑切片绝 ...

  • R语言中创建函数参数的问题

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. Sys.setlocale('LC_ALL','C') ## [1] &q ...

  • R语言中连接dplyr的join系列与merge函数

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 在数据分析过程中,仅仅涉及一张表格的情况是非常少见的,我们经常需要联系到其 ...

  • R语言中的偏最小二乘回归PLS-DA

    原文链接:http://tecdat.cn/?p=8890 主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合来自预测变量的主成分(PC).这带来许多优点: 预测变量的数量 ...

  • R语言中进行期权定价的Heston随机波动率模型

    原文链接:http://tecdat.cn/?p=12111 在本文中,我将向您展示如何模拟股票价格的Heston随机波动率模型. Heston模型是一种期权估值方法,它考虑到同一资产在给定时间交易的 ...

  • ggClusterNet:手写算法在R语言中实现Gephi布局之一

    写在前面 像不像Gephi出图,Gephi布局还是有很多人喜欢,R语言确实不好实现,这个算法需要大量的迭代,让模块化点之间连线最短,不断修正,很耗费时间,我将聚类算法和修改后的距离算法合并起来并结合节 ...

  • R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

    原文链接:http://tecdat.cn/?p=20882 1导言 这篇文章探讨了为什么使用广义相加模型 是一个不错的选择.为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择 ...

  • R语言中的隐马尔可夫HMM模型实例

    原文链接:http://tecdat.cn/?p=17592  最近,我们使用隐马尔可夫模型开发了一种解决方案,并被要求解释这个方案. HMM用于建模数据序列,无论是从连续概率分布还是从离散概率分布得 ...

  • R语言中回归和分类模型选择的性能指标

    原文链接:http://tecdat.cn/?p=11334 有多种性能指标来描述机器学习模型的质量.但是,问题是,对于问题正确的方法是什么?在这里,我讨论了选择回归模型和分类模型时最重要的性能指标. ...