深入理解流式连接:类型、原理与窗口应用
1. 流式连接基础概念
流式连接在数据处理中有着独特的表现,它与传统的连接表不同。连接表通常只是在特定时间点捕获整个连接的快照,而连接流则能捕捉连接随时间演变的历史。撤销/回缩行对于流捕获 TVR(时态版本关系)的全保真视图至关重要。
2. 各类连接类型详解
- FULL OUTER JOIN :它是一种核心的连接原语,是一个从流到表的分组操作,能将关系中所有已连接和未连接的行收集在一起。
- LEFT OUTER JOIN :是在 FULL OUTER JOIN 的基础上,移除右数据集里所有未连接的行。例如:
12:00> SELECT STREAM Left.Id as L,
12:10> SELECT TABLE Right.Id as R,
Left.Id as L,
Sys.EmitTime as Time,
Right.Id as R
Sys.Undo as Undo
FROM Left LEFT OUTER JOIN Right FROM Left LEFT OUTER JOIN Right
ON L.Num = R.Num; ON L.Num
超级会员免费看
订阅专栏 解锁全文
1141

被折叠的 条评论
为什么被折叠?



