Data Mining
文章平均质量分 79
streamcc
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘--聚类之K均值算法
1.聚类概念 聚类是将物理或抽象对象的集合分成相似的对象类的过程。使得同一个簇中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。簇是数据对象的集合,这些对象与同一簇中的对象彼此相似,而与其他簇的对象相异。 聚类可形式描述为: D={o1, o2, ……, on}表示一个对象集合, oi表示第i个对象,i={1, 2,……,n};原创 2013-11-01 21:10:06 · 2095 阅读 · 0 评论 -
数据挖掘--分类之决策树算法ID3
一、决策树: 一棵决策树由一个根节点,一组内部节点和一组叶节点组成。每个内部节点(包括根节点)表示在一个属性上的测试,每个分枝表示一个测试输出,每个叶节点表示一个类,有时不同的叶节点可以表示相同的类。 建立一棵决策树,需要解决的问题主要有: 1)如何选择测试属性? 测试属性的选择顺序影响决策树的结构甚至决策树的准确率,一般使用信息增益度量来选择测试属性。 2)如何停止划分样本?原创 2013-11-08 17:31:45 · 2631 阅读 · 0 评论
分享