UDF(User Defined Function):spark SQL中用户自定义函数,用法和spark SQL中的内置函数类似;是saprk SQL中内置函数无法满足要求,用户根据业务需求自定义的函数。hive中UDF的使用请看这里
下面看一个UDF在sparksql中的使用的简单demo:
package spark
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.types.{StringType, StructField, StructType}
/**
* spark中udf的简单使用;
*/
object sparkUDF {
def main(args: Array[String]): Unit = {
val spark = SparkSession
.builder()
.appName("Spark SQL UDF Example")
.master("local[4]")
.getOrCreate()
import spark.sql
val sc = spark.sparkContext
val names = Array("jason", "jim", "jam","jj")
val nameRDD = sc.parallelize(names, 10)
val n