map-reduce练习

练习1:有如下的数据,其中第一列为用户ID,后面数列为他的朋友ID

A B C D E F
B A H C D E I
C B E G A J
D A B E
E H A B C D G
F A J G
G C E F I
H B J E
I G B
J H C F

编写map-reduce任务完成:找到所有有共同朋友的用户ID对
生成格式为 (用户ID,用户ID 共同朋友ID)

B,C A
D,A E

1.创建文本文件1.txt用于保存数据
vim 1.txt
A B C D E F
B A H C D E I
C B E G A J
D A B E
E H A B C D G
F A J G
G C E F I
H B J E
I G B
J H C F

2.编写mapper

vim mapper.py
#!/usr/bin/env python
import sys
for line in sys.stdin:
        line = line.strip()
        ids = line.split()
        for id in ids[1:]:
                print '%s\t%s'%(id,ids[0])

3.编写reducer

#!/usr/bin/env python
#__coding:utf8__
import sys
from operator import itemgetter
#用于保存当前共同朋友的id
current_common_id = None
#用于保存上一个共同朋友的id
common_id = None
#定义列表,用于保存有共同朋友的所有用户id
current_ids = []
for line in sys.stdin:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值