
spark
搬运工小刚
这个作者很懒,什么都没留下…
展开
-
Spark 知识点
文章目录spark是什么?有什么?RDD:弹性分布式数据集spark运行原理:spark任务划分:spark宽依赖和窄依赖:spark转换算子和行动算子:reduceByKey(func)和groupByKey()的区别:spark数据倾斜:出现数据倾斜的原因:工作时我的应对:解决方案:spark优化:spark shuffle调优updateStateByKey: 有状态的转化操作spark几种部署模式spark-submit 提交作业参数和过程作业参数过程:spark wordcount:sparkst原创 2020-05-09 11:06:40 · 308 阅读 · 0 评论 -
spark 、 spark SQL 读取HDFS中的文件 处理数据
spark 、 spark SQL 读取HDFS中的文件 处理数据在IDEA中:导入 spark-core_2.11的依赖包 版本和安装spark的版本相同Object ConnTest{ def main(args: Array[String]): Unit = { val conf = SparkConf().setMaster("local[2]").setAppName("ap...原创 2020-04-13 20:20:41 · 3814 阅读 · 0 评论 -
在IDEA中运行SparkSQL读取hdfs文件报java.io.IOException: (null) entry in command string: null ls -F F:\tmp\hive
在IDEA中运行Spark SQL读取hdfs文件时报java.io.IOException: (null) entry in command string: null ls -F F:\tmp\hive的错,或者是报 Exception in thread "main" org.apache.spark.sql.AnalysisException: java.lang.RuntimeExcep...原创 2020-01-07 18:36:47 · 3021 阅读 · 0 评论