安装过程的所有命令行:
wget http://lib.stat.cmu.edu/R/CRAN/src/base/R-3/R-3.0.0.tar.gz
tar xzf R-3.0.0.tar.gz
cd R-3.0.0
mkdir -p ~/software/R
./configure --prefix=~/software/R --enable-R-shlib
./configure --prefix=/home/ningci.wkl/software/R --enable-R-shlib
make
make install
vim ~/.bash_profile #添加到PATH中: PATH=/home/user/software/R/bin:$PATH
source ~/.bash_profile #直接运行R命令(大写)
R
安装R语言是为了快点计算特征间的相关系数,果然很方便。
> data=read.table("~/xx/train1.scaled.csv" , header=T)
> head(data)
A B C D E F G
1 1 1.00 10 0.90 0.70 0.85 1
2 1 0.95 9 0.80 0.75 1.00 1
3 1 0.95 12 0.85 0.80 1.00 1
> cx<-cor(data)
>cx
A B C D E F G
A 1.0000000 0.9708921 0.7285008 0.9502806 0.9411747 0.9411304 后面还有一列
B 0.9708921 1.0000000 0.7401940 0.9395102 0.9478164 0.9451363
C 0.7285008 0.7401940 1.0000000 0.6232669 0.6069998 0.6856405
D 0.9502806 0.9395102 0.6232669 1.0000000 0.9677291 0.9187036
E 0.9411747 0.9478164 0.6069998 0.9677291 1.0000000 0.9164279
F 0.9411304 0.9451363 0.6856405 0.9187036 0.9164279 1.0000000
G 0.9816907 0.9879376 0.7418429 0.9554602 0.9560029 0.9590539
对角线都为1,其他的是两两特征之间的相关系数