CDH运维

本文记录了CDH集群中遇到的一些运维问题,包括Cloudera Management Service的内存警告处理,HDFS NameNode和SecondaryNameNode的heapsize调整,YARN spark-shell的配置修复,Spark启动错误的解决,以及CM Server的异常处理和日志目录调整。

Cloudera Management Service

2020.04.13 10:22
发出警告,修改java内存
在这里插入图片描述
在这里插入图片描述

配置结束后重启服务,偶尔会出现红色警报
Cloudera Manager Server GC cpu使用率为总处理时间的10%或更多。
过了一会儿,红色警报自动消失。

HDFS

2020.04.13 10:47
警告:NameNode和SecondaryNameNode有不同的heapsizes
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
修改SecondaryNameNode Java堆栈大小与 NameNode 相同 4G
在这里插入图片描述

2020.04.17 15:34
修改完所需目录位置之后,hdfs启动报错,找不到文件或者是文件权限不够
执行
在这里插入图片描述
注:本机设置,非HDFS
chmod 755 /data
chown root:root /data

YARN

2020.04.13 20:33
执行spark-shell报错
修改yarn相关配置
在这里插入图片描述

Spark

2020.04.13 15:33
安装spark完成后启动报错
在这里插入图片描述
报错修改:给spark服务提供他需要的一切文件夹目录

在这里插入图片描述
Spark相关端口

CM Server

2020.04.15
测试数据导出任务时,发现cdh平台页面无法登录,cloudera manager server异常关闭,并无相关日志输出,手动关闭其他服务,再次重启之后,也没有日志输出到原日志目录文件,查看Server状态时,显示报错空指针异常。
在这里插入图片描述

尝试操作:
执行修改 vi /etc/security/limits.d/cloudera-scm.conf
在这里插入图片描述

修改cloudera-scm-server.log以及cloudera-scm-server其相关属主和属组

chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-server
chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-server/*

2020.04.15 16:22
调整各个节点警告/报警:
在这里插入图片描述在这里插入图片描述
10G --> 6G
在这里插入图片描述
2020.04.15 20:46
修改所有组件的日志目录为/data/var/log
修改堆转储目录为/data/oom_heap_dump_dir

2020.04.16 19:46
报警 percle目录存储空间不足

2020.04.17 10:39
将所有组件的相关目录转移到/data下

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值