R语言学习笔记<数据类型>-优快云博客

本文介绍了R语言中数据类型的使用，包括向量、矩阵、因子、数据框和函数。详细解释了因子的有序和无序特性，以及如何通过tapply和table函数进行数据聚合和频率分析。此外，阐述了数据框的读取与自定义方法，如read.csv和read.table，以及如何通过class函数查看数据类型。文章还讲解了数据框的子集操作和数据的写入方法，如write.csv和write.table。最后，提供了修改数据框列类型及隐藏警告的方法，并分享了两个技巧：不显示警告和调用外部R文件。

数据类型：

①向量。向量是R中最重要的类型。有c(),seq()等方法可以构造。

②矩阵（数组）

③因子（factor）

④数据框（frame)

⑤函数

因子：有序因子和无序因子

因子是一种向量对象，它给自己的组件指定了一个离散的分类（分组），它的组件由其他等长的向量组成。

函数factor()创建一个因子： statef <- factor(state)

levels(statef)可以观察因子中有多少不同的水平。

tapply(state,statef,function):对第一个参数的组件中所包含的每个组应用一个函数function,函数的结果是一个长度与因子水平数相等的结果。

table()：求因子出现的频数。

数据框：read.csv()返回的是data.frame类型，查看类型用class()函数。

data.frame选子集操作(which)：chafer.data[which(chafer.data["xxx"]==3),]选取chafer.data中xxx的值为3的所有的行。返回的类型也是data.frame

如何自定义一个data.frame？

一开始指定列名和数据：data.frame(年龄=c(22,23,20),身高=c(170,159,168))

修改列名：colnames(xxx) <- c(“年龄(岁)","身高(cm)")

read.csv和read.table读取外部数据

read.table(file, header = FALSE, sep = "", quote = "\"‘", dec = ".", skip = 0, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")

①file表示要读取的文件。file可以是绝对路径或者相对路径，但是一定要注意，因为在R语言中\是转义符，所以路径分隔符必须写成\\或者写出/，比如“C:\\myfile\\myfile.csv”或“C:/data.csv”.

②可以使用剪切板的内容，可以用于读取excel格式的文件，将要读取的数据进行复制,然后在R中输入data<-read.table("clipboard",T)即可.

③使用file.choose()，弹出对话框，让你选择文件位置。推荐使用此种方法，免去了记忆和书写文件路径的麻烦，特别是能够避免因数据文件位置移动带来的错误！

例如：read.table(file.choose(),...).

write.csv和write.table写入数据到外部

Alternatively, you can use choose.files() to get a little more of the typical Windows "Save as" behavior:

Allow the user to define a filename which doesn't exist yet
Add a caption to the dialogue box
Default to .csv file type without the user having to type it

     write.csv(tweets, file=choose.files(caption="Save As...", filters = c("Comma Delimited Files (.csv)","*.csv")),row.names=FALSE)
     #row.names表示是否需要行名，默认行名是1,2,3,4...  修改行名使用row.names(tweets) <- c("xx","yy",...)