一.导入数据方式
1.使用键盘输入数据
#首先创建一个空的数据框,然后用edit,R将会弹出一个数据编辑窗口
> mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
> mydata<-edit(mydata)#也可以写成fix(mydata)
2.从带分隔符的文本文件导入数据
#用Windows系统时对于文件地址需要用反斜杠或者转移字符 也可以用read.csv
metadata<-read.table('C:\\Users\\Lianjia\\Desktop\\kucun.csv',header=TRUE,sep=',')
str(metadata)#可以查看每列数据类型
但是默认情况下,read.table会把字符变量转化为因子,这并不一定是我们想要的情形,通常情况下我们只会把有序变量和分类变量转化为因子,因此,对于不想转化成因子的变量而言,可以做如下处理:
metadata<-read.table('C:\\Users\\Lianjia\\Desktop\\kucun.csv',header=TRUE,sep=',',colClasses = c("character","int","int","int","int","int","character","int","character","int","character","int","character"))
3.读取excel文件,读取excel文件的最好方式是将这个excel文件转化为以逗号分隔的csv文件,然后导入。
4.导入spss\sas\HDF5\NETCDF这些文件基本上导入相应的包,打开本地文件地址即可。如ncdf\Hmisc\foreign这些包
二.访问数据库管理系统
odbcConnect():建立一个到ODBC数据库的连接
sqlFetch():读取ODBC数据库中的某个表到一个数据框中
sqlQuery():向odbc数据库提交一个查询并返回结果
sqlSave():将数据框写入或更新到ODBC数据库中
sqlDrop():删除数据库中的某个表
close(channel):关闭数据库连接
> library(RODBC)
> #连接数据库
> myconn<-odbcConnect("mysdn",uid="Rob",pWD="aardvark")
> crimedat<-sqlFetch(myconn,Crime)
> pundat<-sqlQuery(myconn,"select * from tablename")
> close(myconn)