
数据挖掘
文章平均质量分 54
laotumingke
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
低版本的Hadoop实现 Apriori 算法Java代码
Apriori 关联规则挖掘的一种算法,其逻辑简单,网上有很多关于算法逻辑的介绍,在此不再赘述。使用hadoop实现Apriori算法的核心在于,循环计算,在Map过程对候选项进行识别,Combine过程和Reduce 过程实现对候选项集的频次统计,并最终输出满足条件的项集合。同样本代码支持低版本的Hadoop运行,欢迎评论交流~原创 2017-03-27 16:41:45 · 2662 阅读 · 4 评论 -
基于密度的聚类算法与Kmeans算法的R语言脚本
本次仅展示简单的使用R语言实现kmeans算法和基于密度的算法 首先是基于密度的R语言脚本:原创 2017-06-08 15:26:48 · 1751 阅读 · 0 评论 -
ItemCF与UserCF协同过滤算法简单入门和一般过程
这是一篇简单的协同过滤算法简介协同过滤算法,对这个名词稍有了解就知道其应用范围之广,常见的淘宝、京东上的商品推荐,再比如网易云音乐的每日新歌推荐,都采用了基于协同过滤的思想。这个算法神奇之处和缺点本篇文章不过多讨论,这里仅介绍协同过滤的一般实现方法,想必也是应用派最为关注的问题。 主要步骤,为以下几点: 获取特征 降噪 归一化 计算相似性 筛选邻居 构建相似矩阵 实现推荐 在详细介绍各个步骤之前,原创 2017-09-24 14:25:40 · 3483 阅读 · 1 评论