
数据挖掘
文章平均质量分 74
linping070
nice girl
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
决策树C4.5算法Java代码
- 加入菜鸟学习网,获得珍藏资源 Java代码 数据挖掘中决策树C4.5预测算法实现(半成品,还要写规则后剪枝及对非离散数据信息增益计算) Java代码 package org.struct.decisiontree; import java.util.ArrayList; import java.util.Ar原创 2010-04-11 16:38:00 · 9698 阅读 · 4 评论 -
关联规则挖掘算法综述
关联规则挖掘算法综述[ 作者:佚名 转贴自:本站原创 点击数:11135 更新时间:4/6/2004 文章录入:admin ]摘 要 本文介绍了关联规则的基本概念和分类方法,列举了一些关联规则挖掘算法并简要分析了典型算法,展望了关联规则挖掘的未来研究方向。1 引言关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,转载 2010-04-07 10:55:00 · 1166 阅读 · 0 评论 -
贝叶斯介绍
贝叶斯介绍 贝叶斯是基于概率的一种算法,是Thomas Bayes:一位伟大的数学大师所创建的,目前此种算法用于过滤垃圾邮件得到了广泛地好评。贝叶斯过滤器是基于“自我学习”的智能技术,能够使自己适应垃圾邮件制造者的新把戏,同时为合法电子邮件提供保护。在智能邮件过滤技术中,贝叶斯(Bayesian)过滤技术取得了较大的成功,被越来越多地应用在反垃圾邮件的产品中。 二、 贝叶斯过滤算法的基本步骤 1.转载 2010-04-07 11:05:00 · 825 阅读 · 0 评论 -
10-fold cross-validation
10-fold cross-validation,用来测试精度。是常用的精度测试方法。将数据集分成十分,轮流将其中9份做训练1份做测试,10次的结果的均值作为对算法精度的估计,一般还需要进行多次10倍交叉验证求均值,例如10次10倍交叉验证,更精确一点。 参考文献: [1] http://ks.cn.yahoo.com/question/1590000871462.html [2] http://转载 2010-04-07 11:09:00 · 1133 阅读 · 0 评论