
数据挖掘
lyc1635566ty
这个作者很懒,什么都没留下…
展开
-
Storm学习笔记
Storm简介Apache Storm 是 Apache 基金会的开源的分布式实时计算系统。与 Hadoop 的批处理相类似,Storm 可以对大量的数据流进行可靠的实时处理,这一过程也称为“流式处理”,是分布式大数据处理的一个重要方向。Storm 支持多种类型的应用,包括:实时分析、在线机器学习、连续计算、分布式RPC(DRPC)、ETL等。Strom 的一个重要特点就是“快速”的数据处理,有 b原创 2017-06-13 17:32:04 · 397 阅读 · 0 评论 -
APRIORI算法详解和python代码
APRIORI算法就是关联分析的一种算法主要概念:频繁项集,关联规则,支持度,置信度。频繁项集:经常出现的一些集合关联规则:意味这两种元素具有某种强烈的联系支持度:数据集中包含该项集的记录占总记录的比例置信度:对应支持度相除详细代码from numpy import * #导入数据 def loadDataSet(): return [[1, 3, 4], [2, 3, 5], [1, 2,原创 2017-06-13 17:38:46 · 1828 阅读 · 0 评论