然后我们再来看,可以看到对于分区,之前我们已经有keyBy用了,我们说keyBy
是用hash值来分区的对吧.
然后我们再来看,这个broadcast这个是广播的方式
广播的方式就是把数据进行广播出去,然后,所有的分区都能收到广播的数据.
然后看到这里有个shuffle这个方式,是进行洗牌的方式,其实就是把数据进行打乱操作,顺序打乱,
然后发到不同的分区上.
然后我们看着这个forward,直传,就是直接放到自己对应的那个分区对吧
然后我们再来看,可以看到对于分区,之前我们已经有keyBy用了,我们说keyBy
是用hash值来分区的对吧.
然后我们再来看,这个broadcast这个是广播的方式
广播的方式就是把数据进行广播出去,然后,所有的分区都能收到广播的数据.
然后看到这里有个shuffle这个方式,是进行洗牌的方式,其实就是把数据进行打乱操作,顺序打乱,
然后发到不同的分区上.
然后我们看着这个forward,直传,就是直接放到自己对应的那个分区对吧