窄依赖
父RDD的一个分区被一个子RDD的一个分区使用,分区是一对一或多对一的对应关系。
如,map、filter等操作。
宽依赖
父RDD的分区被多个子RDD的分区使用,分区是一对多的对应关系,那么就会有如何分配的问题(shuffle过程)。
如,groupByKey等操作。
宽依赖、窄依赖是理解划分Stage的重要概念。
了解Stage的划分
父RDD的一个分区被一个子RDD的一个分区使用,分区是一对一或多对一的对应关系。
如,map、filter等操作。
父RDD的分区被多个子RDD的分区使用,分区是一对多的对应关系,那么就会有如何分配的问题(shuffle过程)。
如,groupByKey等操作。
宽依赖、窄依赖是理解划分Stage的重要概念。
了解Stage的划分