
spark
运动人生
本人很懒,什么都没留下!
展开
-
spark 生产线上碰到的问题
spark 生产线上碰到的问题1、第一张错误信息图片 2、第二张错误信息图片 3、第三张错误信息图片 4、第四张sparkUI上显示的信息 一、产生事故的背景: 上线一个疲劳驾驶事件处理的流式分析,由于中间业务处理的代码逻辑有变更,导致需要重新部署。每次都是将checkpoint中的元数据删掉,因为已经过了比较长的时间了,而且又用到updateStateByKey...原创 2018-09-08 16:38:21 · 1149 阅读 · 0 评论 -
Spark线上日志处理
spark线上日志处理1、日志产生的背景 多个spark程序在线上跑,每天打印很多的info日志和业务中的调试日志2、日志导致的问题 由于程序中的日志没有控制好,导致磁盘空间很快就被占满了,最终hdfs的datanode和namenode挂掉,最终整个集群瘫痪3、解决办法 1)首先将spark的conf目录下log4j.properties默认info级别改成warn级别 ...原创 2018-09-21 18:11:20 · 1095 阅读 · 0 评论 -
Spark本地调试和程序重启checkpoint恢复碰到的问题
Spark本地调试和程序重启checkpoint恢复碰到的问题1、产生问题的背景 今天自测Spark程序碰到两个问题,(1)、启动流式程序报错 (2)、重启Spark程序,同一个对象的部分数据恢复了,一部分没有恢复 第一个问题的报错信息: 第二个问题的结果信息:2、排查问题的原因 第一个问题的原因是:没有配置hadoop的环境变量,导致在写checkpoint数据的时候报错了...原创 2018-09-29 20:34:03 · 1522 阅读 · 0 评论