
数据挖掘
路人张的鱼生
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python数据挖掘入门与实践-OneR分类算法
Python数据挖掘入门与实践-OneR分类算法OneR算法OneR算法是根据已有的数据中,具有相同特征值的个体最可能属于哪个类别进行分类。在本例中,只需选区Iris是个特征中分类效果最好的一个作为分类依据。使用OneR算法对植物进行分类离散化数据集的特征为连续值,把连续值转变为类别行,这个过程叫作离散化。1、准备数据集每条数据集中给出了四个特征:sepal length,sepa...原创 2019-03-30 23:54:42 · 492 阅读 · 0 评论 -
Python数据挖掘入门与实践--亲和性分析
Python数据挖掘入门与实践–亲和性分析说明这段时间时间找了好多关于数据挖掘方向的数据,不过这些书籍大都偏向理论,看起来也比较枯燥乏味,碰巧今天找到了这本《Python数据挖掘入门与实践》,入门级别,刚好适合我这种爱代码不爱理论的人,从今天开始正式学习数据挖掘。博客中展示的大部分代码都是按照书中的内容编写出来,有些地方会按照自己的思路有一小部分的改动亲和性分析定义亲和性分析根据样本个体...原创 2019-03-27 16:44:02 · 732 阅读 · 0 评论 -
Mapreduce之购物篮分析
Mapreduce之购物篮分析样例输入crackers,bread,bananacrackers,coke,butter,coffeecrackers,breadcrackers,breadcrackers,breadcrackers,bread,coffeebutter,cokebutter,coke,bread,crackers样例输出mapper阶段package...原创 2019-06-18 20:21:19 · 1334 阅读 · 0 评论