3
关于file,暂时只提几个简单操作。其余待实战再做应用。
使用getwd()获取数据目录,setwd()设定数据目录。
> setwd("E:/All/数据挖掘/data")
> getwd()
[1] "E:/All/数据挖掘/data"
注意所有“\”都要改为“/“。
读取数据。暂时只试了read.table()(除此之外还有scan和read.fwf...)
read.table()用来创建一个数据框,是读取表格数据的主要方法。
>mydata<-read.table("data.dat")
>mydata
...//显示数据
试着读取了excel文件,目前只试过全选粘贴到剪切板在读入数据的方法。
//全选copy之后
>mydata<-read.table(clipboard)
使用函数write(x,"*.*")写入文件。
> x<-906130960
> mydata<-write(x,"data.txt")
即在data.txt中写入了字符串“906130960”。data.txt入若不存在会自动生成,但每次向同一文件,后来的会覆盖原先的内容。
4
生成数据。
产生一个1到30的规则整数序列,使用算子”:“。
> x<-1:30
> x
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
有关算子”:“的优先级。
> 1:10-1
[1] 0 1 2 3 4 5 6 7 8 9
> 1:(10-1)
[1] 1 2 3 4 5 6 7 8 9
> seq(7,13,0.5)
[1] 7.0 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 12.5 13.0
可以直接输入序列。
> c(1,2,3,4,5,6,7)
[1] 1 2 3 4 5 6 7
或使用scan()键盘键入。
> z<-scan()
1: 1 2 3 4 5 6 7 8 9
10:
Read 9 items
> z
[1] 1 2 3 4 5 6 7 8 9<strong>
</strong>
注意结束时按两次回车,出现read n items字样,完成输入。
函数rep(x,n)用以创建一个包含n个值为x的向量。
> rep(1,20)
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
函数sequence(x1:x2)用以创建一系列连续的整数序列。每个序列以给定的参数数值结尾。
> sequence(3:5)
[1] 1 2 3 1 2 3 4 1 2 3 4 5
> sequence(c(10,5))
[1] 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5