
spark
Au苗子
这个作者很懒,什么都没留下…
展开
-
spark部署方式之client 和cluster的区别
在使用spark-submit提交Spark任务一般有以下参数:./bin/spark-submit \ --class <main-class> \ --master <master-url> \ --deploy-mode <deploy-mode> \ --conf <key>=<value> \ ... ...原创 2020-02-26 21:59:23 · 5943 阅读 · 0 评论 -
Spark 中 Partition,Task,core,Executor的个数决定因素和关系
分区(Partition)数我们都知道一个 RDD 中有多个 Partition,Partition 是 Spark RDD 计算的最小单元,决定了计算的并发度。分区数如果远小于集群可用的 CPU 数,不利于发挥 Spark 的性能,还容易导致数据倾斜等问题。分区数如果远大于集群可用的 CPU 数,会导致资源分配的时间过长,从而影响性能。那么,Partition 的数量是由什么决定的呢?...原创 2020-02-08 00:10:16 · 9854 阅读 · 0 评论