spark
文章平均质量分 84
职场江湖指北
关注公众号「职场江湖指北」,解答更多offer选择问题!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark学习笔记—核心算子(二)
spark学习笔记—核心算子(二) distinct算子 /** * Return a new RDD containing the distinct elements in this RDD. */ def distinct(numPartitions: Int)(implicit ord: Ordering[T] = null): RDD[T] = withScope { def removeDuplicatesInPartition(partition: Iterator[原创 2021-09-22 23:04:51 · 227 阅读 · 0 评论 -
spark学习笔记—核心算子(一)
spark学习笔记—核心算子(一) HashPartitioner的决定分区的逻辑 核心方法 def getPartition(key: Any): Int = key match { case null => 0 case _ => Utils.nonNegativeMod(key.hashCode, numPartitions) } /* Calculates 'x' modulo 'mod', takes to consideration sign of x,原创 2021-09-06 10:40:29 · 391 阅读 · 0 评论
分享