sparkSql分析函数和窗口函数(rows/range)的语法及案例

本文介绍了SparkSQL中分析函数的语法,包括sum、max、min、count、avg等聚合函数以及lead、lag、rank等排名函数。重点解析了over关键字、partition by、order by和rows/range子句的功能。并通过rank()排名函数、lag()和lead()比较函数以及range()和rows()窗口函数的案例进行了深入讲解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1分析函数的语法:

分析函数名(参数) over(partition by子句order by子句rows/range子句)

1.1分析函数名:
          sum、max、 min、 count、 avg等聚合函数
          lead、 lag等比较函数
          rank等排名函数
1.2over关键字
          表示前面的函数是分析函数,不是普通的聚合函数
1.3分析子句: over关键字后面括号内的内容为分析子句,包含以下三部分内容.
          partition by :分组子句,表示分析函数的计算范围,各组之间互不相干
          order by:排序子句,表示分组后,组内的排序方式
          rows/range: 窗口子句,是在分组(partition by)后,表示组内的子分组(也即窗口),是分析函数的计算范围窗口


2案例:

2.1 rank()排名函数案例:

package sparkSql

import java.util.Properties

import org.apache.spark.sql.{DataFrame, SparkSession}
object sparkSql_fenxi {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder().master("local[2]")
      .appName("Spark SQL anal
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值