大数据系列hadoop——MapReduce实例——好友推荐

最新推荐文章于 2024-05-24 09:45:00 发布

原创

最新推荐文章于 2024-05-24 09:45:00 发布 · 4.4k 阅读

CC 4.0 BY-SA版权

文章标签：

本文介绍了一个使用Hadoop MapReduce实现的好友推荐系统。通过分析用户的好友列表，找出可能存在认识关系的两人，共同好友数量作为判断依据。Map阶段按顺序组合人名并输出，Reduce阶段进行累加计算，排除直接好友，确定潜在的好友推荐。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、简介

好友推荐功能简单的说是这样一个需求，预测某两个人是否认识，并推荐为好友。

某两个非好友的用户，他们的共同好友越多，那么他们越可能认识。

比如，原始数据如下

Tom Cat Hello Hadoop Spring
Cat Hello Spring
Hello Tom Netty Hadoop Cat 
Hadoop Tom Hello Netty Spring 
Spring Tom Cat Hadoop
Netty Hello Hadoop

每一行表示某个用户的好友列表，每一行的第一个名称为该用户的用户名，后面跟的用户名表示他的好友

那么我们需要得到如下的数据

Tom Netty 2
Cat Netty 1
Cat Hadoop 3
Hello Spring 3
Spring Netty 1

这里每一行的两个用户名即为预测的可能认识的两个用户，数字表示他们共有的好友数

200万优质内容无限畅学