
Note for DM
anddyhua
这个作者很懒,什么都没留下…
展开
-
Introduction to Machine Learning课后习题答案
Introduction to Machine LearningSolutions to Exercise by Ethem Alpaydn原创 2021-05-06 20:31:27 · 748 阅读 · 1 评论 -
数据挖掘标准流程——CRISP-DM
WIKI上的CRISP-DMCRISP-DM stands for Cross Industry Standard Process for Data Mining[1]. It is a data mining process model that describes c转载 2011-08-16 13:30:42 · 1990 阅读 · 0 评论 -
R中实现正太分布
library(ggplot2)#rnorm(1000)模拟产生1000个正太分布数ID <-c(seq(1,1000))randNorm <-rnorm(1000)#密度函数randDensity <- dnorm(randNorm)#σ=0.5randDensity1 <- dnorm(randNorm,0,0.5)ID1 <-c(seq(10...原创 2018-08-19 14:34:01 · 1191 阅读 · 0 评论 -
R读写文件
#Error: '\U' used without hex digits in character string starting ""C:\U"#setwd("C:\Users\anddyhua\Desktop") ##文件路径需要全路径并且转义路径,不然报错# Error in file(file, "rt") : cannot open the connection# In ad...原创 2018-08-22 18:13:32 · 4424 阅读 · 0 评论 -
R环境变量
#查看R的HOME目录Sys.getenv("HOME")#查看当前已经加载的包packages()#查看当前安装的包,可以通过library("包名")显示加载library()#查看启动时默认的安装包getOption("defaultPackages")#自动更新已经安装的包到最新install.packages()#默认镜像列表chooseCRANmirror()...原创 2019-03-13 15:13:38 · 1372 阅读 · 0 评论 -
自然划分的3-4-5规则
自然划分的3-4-5规则常被用来将数值数据(连续型数据)划分为相对一致、更自然的区间, 规则的划分步骤:(1) 如果一个区间最高有效位上包含3,6,7或9个 不同的值,就将该区间划分为3个等宽子区间; (为7的话,划分成 2,3,2的宽度比例) ;(2) 如果一个区间最高有效位上包含2,4,或8个不 同的值,就将该区间划分为4个等宽子区间;(3) 如果一个区间最高有效位上包含1,5,或...转载 2019-03-27 02:52:17 · 4093 阅读 · 6 评论 -
spss clementine Twostep Cluster(两步聚类 二阶聚类)
一 、前提条件:1.变量之间不存在多重共线性;2.变量服从正态分布;二、原理:第一步,预聚类、准聚类过程:构建聚类特征树(CFT),分成很多子类。开始时,把某个观测量放在树的根节点处,它记录有该观测量的变量信息,然后根据指定的距离测度作为相似性依据,使每个后续观测量根据它与已有节点的相似性,放到最相似的节点中,如果没有找到某个相似性的节点,就为它形成一个新的节点。第二步,...转载 2011-08-16 12:59:25 · 7408 阅读 · 0 评论