
Spark
Ethan130
coding a world
展开
-
Spark任务调度失败记录
场景: 1、hive on spark 2、开启了动态资源分配(set spark.dynamicAllocation.enabled = true) 结果/报错日志: 21/01/06 05:09:35 WARN cluster.YarnClusterScheduler: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and ha...原创 2021-01-06 15:50:08 · 1181 阅读 · 0 评论 -
spark报错ERROR yarn.ApplicationMaster:
报错如下: 原因:代码里设置的master与yarn提交冲突 解决方式:把本地测试配置master的local[ n ] 注掉 ```java ERROR yarn.ApplicationMaster: Uncaught exception: java.util.concurrent.TimeoutException: Futures timed out after [100000 milliseconds] at scala.concurrent.impl.Promise$DefaultPromis原创 2020-06-19 21:38:10 · 4309 阅读 · 0 评论 -
Hive引擎替换为Spark(Hive on Spark)
Hive引擎替换为Spark(Hive on Spark)1、背景2、Hive引擎选择3、三种引擎如何切换引擎?4、hive on spark配置集群模式5、hive on spark参数调优6、结束语 1、背景 Hive on Spark是由Cloudera发起,由Intel、MapR等公司共同参与的开源项目,其目的是把Spark作为Hive的一个计算引擎,将Hive的 查询作为Spark的任务提交到Spark集群上进行计算。通过该项目,可以提高Hive查询的性能,同时为已经部署了Hive或者Spark的原创 2020-05-18 22:44:39 · 12726 阅读 · 0 评论 -
sparkRDD练习题
给定数据如下: 班级ID 姓名 年龄 性别 科目 成绩 12 张三 25 男 chinese 50 12 张三 25 男 math 60 12 张三 25 男 english 70 12 李四 20 男 chinese 50 12 李四 20 男 math 50 12 李四 20 男 english 50 12 王芳 19 女 chinese 70 12 王芳 19 女 math 70 12 王芳...原创 2018-11-03 11:20:38 · 4586 阅读 · 0 评论 -
Spark面试题、答案
一、简答题 1.Spark master使用zookeeper进行HA的,有哪些元数据保存在Zookeeper? 答:spark通过这个参数spark.deploy.zookeeper.dir指定master元数据在zookeeper中保存的位置,包括Worker,Driver和Application以及Executors。standby节点要从zk中,获得元数据信息,恢复集群运行状态,才能对外...转载 2018-11-03 20:27:31 · 1845 阅读 · 0 评论 -
copyAndReset must return a zero value copy(Spark2.*累加器报错)
错误如下: 字面意思理解 解决方式: 累加器isZero返回true原创 2019-01-08 20:06:23 · 491 阅读 · 0 评论 -
Multiple ES-Hadoop versions detected in the classpath; please use only one
最近在搞ES+spark的时候出现了如下问题: Multiple ES-Hadoop versions detected in the classpath; please use only one 19/08/14 05:03:53 WARN scheduler.TaskSetManager: Lost task 0.0 in stage 12.0 (TID 632, datanode003...原创 2019-08-14 21:41:21 · 2501 阅读 · 0 评论