
spark
spark
咸鱼还是要有梦想的
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
华为大数据客户端安装步骤
解压tar包 进入解压路径./install.sh /approot1/utility/hadoopclient/,后面的地址为一个解压空地址 Cd /approot1/utility/hadoopclient/ source bigdata_env kinit itdw -k -t /approot1/utility/hadoopclient/keytab/itdw.keytab ...原创 2019-10-12 09:53:28 · 940 阅读 · 0 评论 -
Spark中cache和persist的区别
转载地址:https://www.cnblogs.com/itboys/p/6416896.htmlcache和persist都是用于将一个RDD进行缓存的,这样在之后使用的过程中就不需要重新计算了,可以大大节省程序运行时间。cache和persist的区别基于Spark 1.6.1 的源码,可以看到/** Persist this RDD with the ...转载 2018-04-13 10:04:59 · 666 阅读 · 0 评论 -
spark性能优化:数据倾斜调优
原博文出自于: http://www.cnblogs.com/zlslch/p/6046276.html 感谢!调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。...转载 2018-04-10 14:19:53 · 668 阅读 · 0 评论 -
spark 运行 File file:/tmp/spark-events does not exist
在/tmp/下创建spark-events文件夹即可原创 2018-04-08 15:15:49 · 6428 阅读 · 0 评论 -
Spark测试程序启动报错A master URL must be set in your configuration
解决方法:进入:Run> Edit Configurations... > Application > "My project name" >Configuraton,设置VMoptions项为-Dspark.master=local.-Dspark.master=local:表示设置我的spark程序以local模式运行.spark运行模式四种...原创 2018-03-20 16:02:15 · 2093 阅读 · 0 评论