【参考】
1.说明
最近在学习Spark(scala),在使用def自定义函数时,遇到传入RDD[String]类型报错,在此记录和分享一下我的解决方法。
data为从txt读入的多组年龄数据(格式为序号+年龄),Average函数的任务是解析出年龄数据,并计算总体的平均。
2.代码
- def定义的语法与python类似;
- Average为函数名,data为传入的参数,其类型为RDD[String],需注意这里需要import org.apache.spark.rdd._,不然会报错;如果传入的数据类型不是RDD[String],也会