背景
问题背景
详细内容可以看这个
反思为啥出现问题
为啥会出现链接里出现的问题,对于goal join 和 join 语义不一样的问题,那是因为分片键设计不合理的情况
如果表a和表b 都是user_id 作分片键,那么goal join 和join 语义就都是一样的
为啥默认的语义是local
这其实让我们在数据分布的时候就最好把按相同的规则进行分片,这样进行分布式join 的时候就不用移动数据了,毕竟数据的移动是最耗时时间的
问题背景
详细内容可以看这个
为啥会出现链接里出现的问题,对于goal join 和 join 语义不一样的问题,那是因为分片键设计不合理的情况
如果表a和表b 都是user_id 作分片键,那么goal join 和join 语义就都是一样的
这其实让我们在数据分布的时候就最好把按相同的规则进行分片,这样进行分布式join 的时候就不用移动数据了,毕竟数据的移动是最耗时时间的