ODPS 下map / reduce 的编写

本文介绍了在ODPS环境下如何编写和运行MapReduce程序,用于处理阿里巴巴大数据中的用户品牌交互记录,实现对用户操作的合并和计数。通过创建输入输出表,利用Eclipse开发并导出为jar文件,在ODPS上执行任务,为后续的复杂预测模型奠定基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

  接到阿里电话说实习和竞赛智能二选一, 真伤心, 在实习前发挥余热吧.

 

   总结一下在ODPS下 编写map / reduce 和进行购买预测的过程.

 

   首先这里的hadoop输入输出都是表的形式, 我们需要一张输入表和一张输出表.

   输入表为 提供的 t_alibaba_bigdata_user_brand_total_1  输出表为自定义的wc_out

   wc_out 需要预先定义.  下面的实例的功能是合并用户对商品的操作并记录重复次数, 创建的wc_out表结构为:

   create table wc_out(user_id string,brand_id string,type string,visit_datetime string,count bigint);

 

  然后在eclipse 中进行map /recduce 程序的编写.

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值