本次课程,我们学习R中用于读取表格数据的reader包的一些基本功能。
有关readr的详细介绍,可以参考*《Mastering Software Development in R》*的1.3节。
读取
在本课程中,我们将使用美国邮政编码上的一个小型数据集。 该表包含有关美国人口普查局发布的城市邮政编码的百分比的信息。
首先,我们使用library()函数载入readr包。
> library(readr)
我们将读入R的文件为urban.csv.gz。 这是用gzip压缩的,逗号分隔值(csv)文本文件。
urban.csv.gz数据文件所在的目录保存在一个名为datapath的R对象中。
让我们使用file.path()函数构造urban.csv.gz文件的完整路径,并将其存储在名为datafile的对象中。然后使用read_csv()函数读取文件,将结果保存到urban变量。
> datafile <- file.path(datapath, 'urban.csv.gz')
> urban <- read_csv(datafile)
Parsed with column specification:
cols(
s

本文介绍了在R语言中如何使用包来读取表格数据,以美国邮政编码数据集为例,讲解了如何指定列数据类型、跳过不读取的列以及限制读取行数。重点提及了函数的`col_types`参数用于设定列类型,`n_max`参数用于限制读取记录的数量。
最低0.47元/天 解锁文章
4369

被折叠的 条评论
为什么被折叠?



