
数据挖掘
zmlsh
这个作者很懒,什么都没留下…
展开
-
数据挖掘技术-离群点检测
5 异常检测方法异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。常见的异常成因:数据来源于不同的类(异常对象来自于一个与大多数数据对象源(类)不同的源(类)的思想),自然变异,以及数据测量或收集误差。异常检测的方法:(1)基于模型的技术:首先建立一个数据模型,异常是那些同模型不能完美拟合的对象;如果模型是簇的集合,则异常是不显著属于任何簇的对象;在使用回归模型时,异常转载 2014-04-14 15:27:51 · 3724 阅读 · 0 评论 -
kNN方法R实现
kNN方法R实现转载于分类: R语言2013-04-23 23:30 442人阅读 评论(0) 收藏 举报KNN算法R语言参考资料:1、基于肖凯大牛的博客2、R IN A NUTSHELL3、DATA MINING WITH R############################ 翻译开始 ######转载 2014-04-17 08:41:48 · 1618 阅读 · 0 评论 -
R语言之聚类
分类: R语言2013-04-21 20:10 603人阅读 评论(0) 收藏 举报R语言聚类利用轮廓系数判断k均值聚类的个数1、kmeans聚类处理的数据必须是数值型numeric,并且必须是matrxi或者data frame2、轮廓系数可以使用 fpc包3、聚类效果没有特殊的评价标准,聚类的个数可以采用这个来判定。4、聚类个转载 2014-04-17 08:39:56 · 2772 阅读 · 1 评论 -
R语言数据挖掘中常用函数
R语言之常用函数集合下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust,转载 2014-04-15 22:21:28 · 1814 阅读 · 0 评论