本来想讲一下hive的一条SQL怎么转换成MapReduce的,但是想了一下还是先讲讲一条SQL语句怎么用MapReduce来执行
join的实现原理
select ply.policy_date,sale.ply_sale_name from ply_base_info ply join ply_sale sale on ply.policy_no=sale.policy_no
在map的输出value中为不同表的数据打上tag标记,在reduce阶段根据tag判断数据来源。MapReduce的过程如下
Group By的实现原理
select policy_date,policy_type,coun