spark
文章平均质量分 93
大数据是一种趋势
cyz0202
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark学习
Spark2.4.5RDD的转换操作学习mapPartitions例子:给定rdd1 = sc.makeRDD(1 to 10, 4),请输出各partition的"|“拼接结果;=> rdd1.mapPartitions(x => Iterator(x.mkString(”|"))).collectnote:要注意Iterator的使用是为了满足partition的要求;...原创 2022-05-23 15:58:38 · 214 阅读 · 0 评论 -
spark-api ByKey三连
spark-api 三连combineByKeyaggregateByKeyfoldByKeycombineByKeycombineByKey定义如下图所示举个例子:一组(key,value),统计各个key的平均值;定义中的V默认为(key,value)中的value;实现如下(类型不声明会报错,比较奇怪)aggregateByKeyaggregateByKey定义如下图所示:比...原创 2020-03-12 01:10:43 · 185 阅读 · 0 评论
分享