数据类型:
①向量。向量是R中最重要的类型。有c(),seq()等方法可以构造。
②矩阵(数组)
③因子(factor)
④数据框(frame)
⑤函数
因子:有序因子和无序因子
因子是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。
函数factor()创建一个因子 : statef <- factor(state)
levels(statef)可以观察因子中有多少不同的水平。
tapply(state,statef,function):对第一个参数的组件中所包含的每个组应用一个函数function,函数的结果是一个长度与因子水平数相等的结果。
table():求因子出现的频数。
数据框:read.csv()返回的是data.frame类型,查看类型用class()函数。
data.frame选子集操作(which):chafer.data[which(chafer.data["xxx"]==3),]选取chafer.data中xxx的值为3的所有的行。返回的类型也是data.frame
如何自定义一个data.frame?
一开始指定列名和数据:data.frame(年龄=c(22,23,20),身高=c(170,159,168))
修改列名:colnames(xxx) <- c(“年龄(岁)","身高(cm)")
read.csv和read.table读取外部数据
read.table(file, header = FALSE, sep = "", quote = "\"‘", dec = ".", skip = 0, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")
write.csv和write.table写入数据到外部
Alternatively, you can use choose.files() to get a little more of the typical Windows "Save as" behavior:
- Allow the user to define a filename which doesn't exist yet
- Add a caption to the dialogue box
-
Default to .csv file type without the user having to type it
write.csv(tweets, file=choose.files(caption="Save As...", filters = c("Comma Delimited Files (.csv)","*.csv")),row.names=FALSE)
#row.names表示是否需要行名,默认行名是1,2,3,4... 修改行名使用row.names(tweets) <- c("xx","yy",...)
这种方法允许让用户自定义一个不存在的文件名,并给一个提示框,且默认是csv文件格式保存。强烈推荐该方法。对于xlsx文件,可以先另存为.csv文件,然后用read.csv()打开。
要修改某一列的类型,比如要修改为numeric,则需要如下方式:
subcollection$证券余额 <- as.numeric(as.vector(subcollection$证券余额))
而不是:
subcollection$证券余额 <- as.numeric(subcollection$证券余额)
另外两个技巧:
①不显示warning的方法:options(warn =-1),默认warn =0设置为-1就不会显示了。
②调用外部R并执行: source("D:\\Chafer\\test.R")
本文介绍了R语言中数据类型的使用,包括向量、矩阵、因子、数据框和函数。详细解释了因子的有序和无序特性,以及如何通过tapply和table函数进行数据聚合和频率分析。此外,阐述了数据框的读取与自定义方法,如read.csv和read.table,以及如何通过class函数查看数据类型。文章还讲解了数据框的子集操作和数据的写入方法,如write.csv和write.table。最后,提供了修改数据框列类型及隐藏警告的方法,并分享了两个技巧:不显示警告和调用外部R文件。

被折叠的 条评论
为什么被折叠?



