R语言数据分析入门(持续更新)
这篇文章会持续更新使用R的基本操作、基本函数与可用资源。
文件导入
想要进行数据分析,首先要进行数据的输入。目前来看,常用的数据导入格式为.csv格式(通常的excel可另存为csv格式),通常会用上read.csv
函数,其详细使用方式我们可以通过在程序中执行 ?read.csv
来确定。这里我们简要了解一下其基础构成。函数结构与说明如下:
read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
file
处可以使用文件的绝对位置如:C://Users//Administrator//Desktop//kpdata.csv
。需要注意的是,文件分级符号应从“\”改为“//”。同时,我们也可以使用相对位置,即该文件相对于当前目录的位置。当前文件目录可以通过getwd()
函数查看。header
的值用于判断文件第一行是否为每一列的标题。如果是,应赋值为TRUE
。
譬如我们想要导入kpdata.csv
这个文件,我们可以这样输入并验证:
> D <- read.csv("C://Users//Administrator//Desktop//kpdata.csv", head = TRUE)
> head(D)
date data
1 20110101 1798726
2 20110102 1996811
3 20110103 2163881
4 20110104 2315822
5 20110105 2255915
6 20110106 2203165
这样我们就得到了包含kpdata.csv
文件内容的变量D
。