
Mahout实战
三名狂客
success without applause,diligence without reward!Becoming、Cognifying、Flowing、Screening、Accessing、Sharing、Filtering、Remixing、Interacting、Tracking、Questioning、Beginning.
展开
-
初始Mahout
Mahout 在理论上可以实现所有的机器学习技术,但实际上当前它仅关注机器学习的三个领域,即推荐引擎(协同过滤)、聚类和分类。 安装Mahout: (1) java 和IDE(eclipse、netbeans、intellij IDEA) (2)安装Maven (3)安装Mahout (4)安装Hadoop原创 2017-04-16 21:03:32 · 794 阅读 · 0 评论 -
推荐系统
推荐:通过对嗜好的模式进行预测,借以发现你尚未知晓,却合乎心意的新事物。 推荐引擎分类:(1)基于用户 (2)基于物品 具体的实现代码如下: package mia.recommender.ch02; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mah原创 2017-04-16 21:37:24 · 740 阅读 · 0 评论 -
mahout之聚类实现
人们常数"物以类聚,人以群分",聚类就是将一个给定的文档集中相似项目分成不同簇的过程。 聚类设计的过程: (1)一个聚类算法( k-means、模糊k-means、canopy等) (2)相似性和不相似性的概念 a.欧式距离 b.平方欧式距离 c. 曼哈顿距离原创 2017-05-08 16:25:12 · 1146 阅读 · 0 评论 -
hadoop平台下Mahout安装与配置
一、下载二进制文件 点击打开链接 二、解压文件 tar -zxvf mahout-distribution-0.9.tar.gz -C /usr 三、 配置环境变量:在/etc/profile, 添加MAHOUT_HOME 环境变量 export MAHOUT_HOME=/usr/apache-mahout-distribution-0.12.2原创 2017-05-28 19:03:23 · 1556 阅读 · 0 评论 -
hadoop 运行mahout 问题总结
完成Hadoop上的搭建,开始运行几个小的测试,毕竟第一次,遇到了一些小问题。 首先,是参考资料中的 验证安装是否成功的步骤。 将下载数据 synthetic_control.data 上传到HDFS中,命令如下 hadoop fs -mkdir testdata(注意,此命令的文件夹路径必须是如上,不可是/testdata 等其他形式) hadoop fs转载 2017-05-29 17:10:52 · 1121 阅读 · 0 评论