Mahout---协同过滤算法示例

最新推荐文章于 2024-01-07 02:04:14 发布

Star-Technology

最新推荐文章于 2024-01-07 02:04:14 发布

阅读量475

点赞数

CC 4.0 BY-SA版权

分类专栏： Big Data 文章标签：协同过滤算法 mahout hafs yarn zookeeper

本文链接：https://blog.youkuaiyun.com/ymf827311945/article/details/74332506

Big Data 专栏收录该内容

140 篇文章

订阅专栏

本文介绍了一种基于物品的协同过滤推荐系统实现过程。通过准备样本数据并使用Mahout工具进行处理，最终实现了推荐算法。文章详细记录了从数据准备到结果查看的各个步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

                                       ***基于物品的协同过滤***

Step 1：
准备样本集item.txt

1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.5
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0

Step 2：
在node11节点上执行命令，建立样本文件

vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/item.txt

这里写图片描述

Step 3：
在三个节点执行命令，启动zookeeper
这里写图片描述

Step 4：
在node11节点上执行命令，启动HDFS和Yarn

start-all.sh

这里写图片描述

在node12节点上执行命令，启动Resourcemanager

yarn-daemon.sh start resourcemanager

这里写图片描述

Step 5：
打开浏览器，输入URL进行查看HDFS
192.168.80.11:50070
192.168.80.12:50070
这里写图片描述

打开浏览器，输入URL进行查看Yarn
192.168.80.11:8088
192.168.80.12:8088
这里写图片描述

Step 6：
在node11节点上执行命令，将文件上传到HDFS中

hadoop fs -mkdir /itemCF
hadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/item.txt /itemCF
hadoop fs -ls /itemCF

这里写图片描述

Step 7：
在node11节点上执行命令，运行Mahout

mahout recommenditembased -s SIMILARITY_LOGLIKELIHOOD  -i /itemCF/item.txt  -o /itemCF/tuijian --numRecommendations 5

这里写图片描述

Step 8：
执行命令，查看运行结果

hadoop fs -cat /itemCF/tuijian/part-r-00000

这里写图片描述