R--基本统计分析方法(包及函数)
摘要3
1、线性模型~回归分析:3
【包】3
【函数】3
【备注】3
2、logistic 回归:3
【包】:3
【函数】:3
【备注】3
3、无监督分类-决策树:4
【包】:4
【函数】:4
【备注】:4
4、支持向量机:4
【包】:4
【函数】:4
5、无监督分类~聚类分析:4
【包】:4
【函数】:4
【备注】:4
6、关联分析:5
【包】:5
【函数】:5
7、主成分分析:5
【包】:5
【函数】:5
【备注】:5
8、对应分析:6
【包】:6
【函数】:6
【备注】:6
9、因子分析:6
【包】:6
【函数】:6
10、神经网络6
【包】:6
【备注】:6
11、随机森林:(回归和分类)6
【包】:6
【备注】:6
12、递归拆分:(回归,分类,生存分析)7
【包】:7
【备注】:7
13、Boosting:(提高给定任意学习算法精确度的方法)7
【包】:7
【备注】:7
14、模型确认和选择:7
【包】:7
【函数】:7
【备注】:7
15、缺失数据7
【包】:7
16、隐变量方法8
【包】:8
【备注】:8
17、有监督分类和判别分析8
【包】:8
【备注】:8
18、典型相关分析9
【包】:9
【备注】:9
R--基本统计分析方法(包及函数)
制作人:土豆渣渣
摘要
目前经典的统计学分析方法主要有回归分析,Logistic 回归,决策树,支持向量机,聚类分
析,关联分析,主成分分析,对应分析,因子分析等,那么对于这些经典的分析方法在R 中
的使用主要有那些程序包及函数呢?
1、线性模型~回归分析:
【包】
stats
【函数】
lm(formula, data, ...)
逐步回归:step(lm(formula, data, ...))
回归诊断:influence.measure(lm(formula, data, ...))
多重共线性:kappa(XX,exact=T), eigen(XX)
自相关检验:一阶:dwtest(y~x) 多阶:bgtest(y~x,order=2,type=”Chisq”)
【备注】
1)stats 包里的 lm()可做多元线形模型,anova.mlm() 比较多个多元线形模型,
manova()做多元方差分析(MANOVA )。
2 )sn 包的msn.mle()和 and mst.mle()可拟合多元偏正态和偏t 分布模型。
3)pls 包提供偏最小二乘回归(PLSR )和主成分回归;
4 )ppls 包可做惩罚偏最小二乘回归;
5)dr 包提供降维回归方法,如:片逆回归法(Sliced Inverse Regression)、片平均
方差估计(sliced average variance estimation) 。
6)plsgenomics 包做基于偏最小二乘回归的基因组分析。
7)relaimpo 包可评估回归参数的相对重要性。
2、logistic 回归:
【包】:
stats
【函数】:
glm(formula, family=gaussian,data, ...)
【备注】
family
binomial(link = "logit")
gaussian(link = "identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "