val goalsDF = Seq(
("messi", 2),
("messi", 1),
("pele", 3),
("pele", 1)
).toDF("name", "goals")
goalsDF.show()
+-----+-----+
| name|goals|
+-----+-----+
|messi| 2|
|messi| 1|
| pele| 3|
| pele| 1|
+-----+-----+
import org.apache.spark.sql.functions._
goalsDF
.groupBy("name")
.agg(sum("goals"))
.show()
+-----+----------+
| name|sum(goals)|
+-----+----------+
| pele| 4|
|messi| 3|
+-----+----------+
Spark scala groupBy后求和
最新推荐文章于 2025-04-27 15:05:54 发布
这篇文章展示了如何使用Apache Spark SQL对球员进球数据进行聚合,计算Messi和Pele各自的总进球数。通过groupBy和agg函数,我们得出Messi进了3球,Pele进了4球的结果。
766

被折叠的 条评论
为什么被折叠?



