hive的join查询

hive的join查询
语法
join_table:
    table_reference [INNER] JOIN table_factor [join_condition]
  | table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference join_condition
  | table_reference LEFT SEMI JOIN table_reference join_condition
  | table_reference CROSS JOIN table_reference [join_condition] (as of Hive 0.10)
 
table_reference:
    table_factor
  | join_table
 
table_factor:
    tbl_name [alias]
  | table_subquery alias
  | ( table_references )
 
join_condition:
    ON expression
    
    // join查询不支持where,改用on来替代

实例:

select count(distinct a.id) from table_1 a join table_2 b on (a.id=b.id) ;
left join/right join

左查询就是不管能不能匹配到右边的表,都会输出左面的表,未匹配到的项目为空

nameage
wang13
zhao14
namescore
wang145
li44
select a.name, b.score from t1 a join t2 b on (a.aid=b.aid);

的结果是:

namescore
wang145
zhaoNULL
注意点
  • 注意,下面这些操作是非法的:
CREATE TABLE a (k1 string, v1 string);
CREATE TABLE b (k2 string, v2 string);

SELECT k1, v1, k2, v2
FROM a JOIN b ON k1 = k2; 

// 选择每个属性的时候需要制定是哪个表,否则会认为有歧义
  • 只支持相等查询的join操作
SELECT a.* FROM a JOIN b ON (a.id <> b.id)

// 非法操作

SELECT a.* FROM a LEFT OUTER JOIN b ON (a.id <> b.id)

// 合法,此处是left outer join
  • 可以支持多个表的查询
SELECT a.val, b.val, c.val FROM a JOIN b ON (a.key = b.key1) JOIN c ON (c.key = b.key2)
后续
  • 目前没有列举全部,如left join 等,需要的可以看这篇文章
  • 主要参考官网文档
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值