- 博客(20)
- 问答 (3)
- 收藏
- 关注
原创 SAS 关联规则
/* 关联规则算法的实现 *//* 读入关联数据,列代表项目集中的一个项目,行代表一个记录集,每行在某列上的值为0表示该记录集不含该项目,为1代表包含该项目 */data test; input id 1 class1 3 class2 5 class3 7 class4 9 class5 11 class6 13 class7 15 ;cards;1 0 0 1 1 0
2017-02-28 18:39:21
3754
原创 SAS 主成分分析
data cor1; input x1-x4; cards;40 2.0 5 2010 1.5 5 30120 3.0 13 50250 4.5 18 0120 3.5 9 5010 1.5 12 5040 1.0 19 40270 4.0 13 60280 3.5 11 60170 3.0 9 60180 3.5 14 40220
2017-02-28 18:34:31
4111
原创 SAS 因子分析
/* 12项智力指标的因子分析 */DATA IND (type=corr); /*指定输入数据为相关系数矩阵*/ infile cards missover; /*读取数据时,输入指针遇到短数据不会跳到下一行来读取,且没有数据的变量会自动设为缺失*/ input _name_ $3.x1-x12; _type_='Corr';
2017-02-28 18:32:43
7338
原创 SAS 生存分析
/*--------------------生存分析--------------------*//*------寿命表法-----*/data sc; input lt@@; /*输入变量lt*/ if lt<0 then censor=1; /*若lt小于0(代表数据删失),则变量censor赋值为1,否则,赋值为0*/ else
2017-02-28 18:31:20
10478
3
原创 SAS 判别分析
分三个数据集: 1. DATA XDT; INPUT c x1-x5 @@; CARDS;1 8.11 251.01 13.23 5.46 7.311 9.36 185.39 9.02 5.66 5.99 1 9.85 249.58 15.61 6.06 6.111 2.55 137.13 9.21 6.11 4.35 1 6.01 231.34 14.27
2017-02-28 18:28:36
10347
原创 SAS 方差分析
/*-----------------单因素方差分析 - PROC ANOVA -------------------*/data retime; input medicine $ hours @@; datalines;A 7 A 5 A 3 A 1B 6 B 5 B 3 B 3C 7 C 9 C 9 C 9D 4 D 3 D 4 D 3;ods graphi
2017-02-28 18:27:28
6063
原创 SAS 典型相关分析
/*--------------------典型相关分析-----------------------------------*//*-----用力肺活量指标和呼气流速指标的相关关系------*/data hq(type=corr); /*指定输入数据为相关系数矩阵*/ input _name_$3.x1 x2 y1-y4; /*依次输入6个指标变量*/
2017-02-28 18:26:13
7332
1
原创 SAS t检验
/*----------------- 一.单样本t检验 -----------------*//*有原始数据的t检验*/DATA TEMP; INPUT X@@; Y=X-20.7; CARDS; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.42 20.90 22.99 23.12 20.89 ;TITLE 'T检
2017-02-28 18:21:59
11457
原创 SAS逻辑回归之多分类
数据集Car(1728个观测值,6个自变量,因变量Car有unacc\acc\good\very good 4个取值。分两个过程实现,代码如下: 1. PROC LOGISTIC 过程实现: /*逻辑回归数据集Car(1728个观测值,每个含6个属性,目标变量Car(unacc\acc\good\very good))*//*导入数据集australian到逻辑库work中
2017-02-28 11:00:00
13207
28
原创 SAS逻辑回归之二分类
数据集这里用的是australian,有14个自变量Xi,一个因变量Y,Y值只取0或1。代码如下: /*逻辑回归数据集australian(690个观测值,每个含14个属性,目标变量y(0、1))*//*导入数据集australian到逻辑库work中*/proc import out=aus datafile="\\vmware-host\Shared Folders\桌
2017-02-28 10:55:51
10480
1
原创 R语言聚类分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》聚类分析是一类将数据所研究对象进行分类的统计方法,这一类方法的共同特点是:事先不知道类别的个数和结构,据以进行分析的数据是对象之间的相似性或相异性的数据。将这些相似(相异)性数据看成是对象之间的“距离”远近的一种度量,将距离近的变量归为一类,
2017-02-27 17:10:27
52776
2
原创 R语言判别分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参数表示,默认是FALSE,表示认为两总体
2017-02-27 17:07:54
31356
2
原创 R语言生存分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》生存分析是研究生存时间的分布规律,以及生存时间和相关因素之间关系的一种统计分析方法。生存分析在医学科学研究中具有广泛而重要的应用价值,它对人群寿命的研究,各种慢性疾病的现场追踪研究,临床疗效试验和动物试验等研究中随访资料的处理骑着举足轻重的作
2017-02-27 17:05:43
27312
2
原创 R语言关联规则
# Apriori算法实现关联规则挖掘#======================= MODEL1. 输入数据集为transaction类型 ======================#install.packages("arules") #Apriori算法程序包library(arules)data
2017-02-27 17:02:38
4990
原创 R语言主成分分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》解决自变量之间的多重共线性和减少变量个数根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一方面。主成分分析可以用较少的变量取代较多的不独立的原变量,减少分析
2017-02-27 17:00:13
28499
1
原创 R语言典型相关分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》1 关键点:典型相关分析典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性将研究两组变量的相关性问题转化为研究两个变
2017-02-27 16:40:46
25493
5
原创 R语言因子分析
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。I.参数估计为了建立因子模型,需要要得到因
2017-02-27 16:31:08
21626
1
原创 R语言方差分析ANOVA
I. 单因素方差分析#用data frame的格式输入数据medicine <- data.frame( Response=c(7,5,3,1,6,5,3,3,7,9,9,9,4,3,4,3), Treatment=factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4))) ) #各组样本大小table(medicine$Treat
2017-02-27 16:23:18
70547
12
原创 R语言t检验
自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。I.单样本t检验例1. 有原始数据的t检验已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异?x <- c(20.99,20.41,20.10,20.00,20.91,22.60,20.99,20
2017-02-27 16:09:06
113169
12
原创 R语言逻辑回归、ROC曲线和十折交叉验证
自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。1. 测试集和训练集3、7分组australian <- read.csv("australian.csv",as.is = T,sep=",",header=TRUE)#读取行数N = length(australian$Y)
2017-02-27 15:49:35
137538
65
空空如也
R怎么确定系统聚类中分类个数? 求R方等统计量的程序?
2016-11-24
R做判别分析,多分类问题的距离判别,同样的程序换个数据就运行不了?
2016-11-22
R语言时间序列画图横坐标问题
2016-11-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人