JOIN ON 的本质是行过滤 + 列合并
- JOIN 的本质就是列合并
- ON 的本质是行过滤,一般使用两个表格的连接字段(外键/连接键)相等作为条件(目前
Hive中只支持等值连接)
(该篇仅介绍最常用的 INNER JOIN 和 LEFT JOIN)
1. INNER JOIN

不论如何,JOIN ON 的本质是行过滤 + 列合并:
INNER JOIN 与 与一般的JOIN通用,其区别是两张表并非完全相同,又要求交集的情况下使用INNER JOIN
具体原理:
SELECT xxx
FROM t_a
JOIN t_b
ON t_a.col1 = t_b.col2
WHERE condition
拿上面代码举例,使用ON将满足t_a表中col1字段和t_b表中col2字段相等的行全部筛选出来(行过滤)进行列合并。(前者默认两张表有不同的部分)
划重点:I

本文详细解析了INNERJOIN、LEFTJOIN的基本概念,比较了ON与WHERE的区别,并通过经典题目展示了JOIN在实际应用中的技巧。重点讲解了JOIN操作的本质——行过滤与列合并,以及在LEFTJOIN中对左表和右表的不同处理。
最低0.47元/天 解锁文章
9545

被折叠的 条评论
为什么被折叠?



