cdh_kiraraLou的博客-优快云博客

cdh

关注

文章平均质量分 57

关注数：文章数：20 文章阅读量：23959 文章收藏量：26

作者: kiraraLou

这个作者很懒，什么都没留下…

展开

【CDP】CDP 集群通过Knox 访问Yarn Web UI，无法跳转到Flink Web UI 问题解决

记录下在CDP 环境中，通过Knox 访问Yarn Web UI，无法跳转到Flink Web UI 的BUG 解决方法。

原创 2023-12-12 16:28:57 · 544 阅读 · 0 评论
【knox】Gateway SSL Certificate is Expired. Server will not start

今天 KNOX 突然无法启动，报错日志与证书过期有关。

原创 2023-05-11 11:35:52 · 688 阅读 · 0 评论
【CDH】cloudera manger 如何开启Debug 日志调试模式

在安装 Cloudera Manger 时，遇到报错，需要开启Debug 日志级别来排查下问题原因。这里记录下 CM 如何开启 Debug 级别。

原创 2023-03-22 17:19:40 · 584 阅读 · 0 评论
【CDP】Cloudera Manager 记录一次 Service Monitor 内存溢出/使用率高的问题及通用排查方案

通过了解 Servcie Monitor 具体的监控指标项，以及每个监控指标项对应的监控 Entity 的数量，来判断是那个监控指标项引起的Service monitor 内存使用率过高。开始的时候，没有过多考虑，只是增加了 JVM 的堆内存大小，但是过段时间有出现，从 16G -> 32G -> 64G，问题还是没有解决，看来必须更深的追一下了。找到监控实体数量最多的一项，问题大概就是由他引起的，可能每个人的情况不一样，这里只给一个通用的排查方向，具体的情况具体解决。滚动重启 Kafka 集群。

原创 2023-01-09 11:12:34 · 1940 阅读 · 0 评论
【CDP】CDP集群如何通过Cloudera Manager配置使用SNMP方式转发告警

这篇文章参考了大神的文章，如何在CDH平台上集成SNMP服务，然后实现了CDP集群集成SNMP服务，这里描述下，如何集成步骤，在CDP集群中告警是一个很重要的信息，最直观的衡量一个集群的健康状况，那么我们如何来管理集群的告警信息？通过Cloudera Manager来管理的CDP集群，提供了多种告警管理方式（如：邮件、SNMP及自定义告警脚本）,本篇文章主要介绍如何通过Cloudera Manager配置使用SNMP方式转发告警。

原创 2023-01-03 17:15:11 · 930 阅读 · 0 评论
【yarn】CDP集群 Yarn配置capacity调度器批量分配

最近要升级集群成集群，CDH 集群中 Yarn 服务默认使用的是 Fa 调度器，CDP 集群使用的是调度器，我们之前淌过调度器因为批量分配设置不合理，导致任务集中分配到了某几台节点，使集群资源负载极度不均衡。为了避免同样的问题出现在 CDP 集群上，我们提前进行调研。看看使用调度器会不会也有集中分配的现象。但是调研过程中，出现了一些不和预期的现象，等待后续跟进。前面介绍过，版本后，针对，有如下几个配置，来针对任务类型（小任务）加快分配的优化。通过合理的配置，我们就可以即使用集中分配的方式，又

原创 2022-07-01 16:50:24 · 1341 阅读 · 0 评论
【CDH】CDH/CDP 环境修改 cloudera manager默认端口7180

最近在配合下游搭建环境的集群，由于测试方为云环境，并且要求外网端口只能使用以上，所以需要修改，由于界面无法打开，所以只能通过修改元数据库，这里我使用的元数据库是MySql。2. 切换数据库(CM的元数据库)3. 查看表数据结果如下：4. 对表新增配置新增查看是否新增成功5. 修改后重启 cloudera-scm-server6. 查看端口是否修改成功修改成功！.........

原创 2022-06-13 11:49:41 · 1902 阅读 · 0 评论
【CDH】CDH5.16 配置 yarn 任务集中分配设置不生效问题

前言记录下 CDH 集群 yarn 服务任务集中分配配置不生效问题。环境信息CDH 5.16Hadoop 2.6.0yarn 为公平调度模式问题经过近日，系统运维反馈说我们的大数据集群有一个节点（nodemanager）内存使用率超过报警阈值，触发告警。排查后发现计算节点（nodemanager）与节点（nodemanager）的负载差距较大，当即就想到了是因为 Yarn 开启了批量分配导致的。加之由于我们的任务都是流式计算任务，单个任务需要用到的 container 数量不多。所以更

原创 2022-05-26 13:10:41 · 1153 阅读 · 0 评论
【CDH】cloudera mamager中配置hive加载第三方JAR

前言再将 hbase 导入 hive 表时，出现行数远远大于实际的数量，排查后发现是hbase 数据中有很多换行，所以需要使用第三方的jar 的行分隔符。这里使用了自定义的jar包。永久添加这时想要使用jar 包每次都需要手动添加，然后才能使用。这里我们使用永久添加的方式。配置Hive 辅助 JAR 目录设置 /opt/cloudera/parcels/CDH/lib/hive/auxlibhive-env.sh 的 Gateway 客户端环境高级配置代码段（安全阀) 设置 HIVE

原创 2022-03-21 14:43:32 · 2143 阅读 · 0 评论
【CDH】通过 ClouderaManager 配置CDH组件用 prometheus + hbase 监控采集JMX信息

前言最近需要在 cloudera manager 监控界面对CDH 的组件来用 prometheus 监控。也参考了很多网上的资料，目前很多都是修改的后台配置文件，目前测试下来，如果通过 cloudera manager 来启动服务，感觉配置没有生效。这里采用在 cloudera manager 监控界面配置参数的方式，已经测试通过。这里整理并记录一下。具体实践这里以 Hbase 服务为例。来进行我们配置，别的组件参考即可。依赖组件需要用到的服务有prometheusgrafanajmx_

原创 2022-03-10 11:43:25 · 3613 阅读 · 0 评论
【HIVE】MetaException(message:Error(s) were found while auto-creating/validating the datastore for cla

问题原因：hive 元数据库信息有问题。解决方法：重新初始化元数据库。CDH集群初始化hive 元数据库参考如下：https://blog.youkuaiyun.com/Mrerlou/article/details/121157908

原创 2021-11-05 14:49:31 · 897 阅读 · 0 评论
【CDH】问题解决：CDH5.16重新初始化hive 元数据信息

文章目录前言一、重新初始化二、操作步骤1.脚本位置2.执行命令3. 执行报错4. 问题原因：5. 解决方案：6. 重新初始化转载：前言之前在搭建CDH集群时，在进行到初始化hive 元数据库时，由于DBA没有放开库所有的权限，导致当时初始化hive元数据信息部分失败。由于集群当时能够正常使用，于是就没有做过多的考虑，今天在创建hive udf时报错，排查下来是当时初始化表时，缺失了几张表。于是决定重新对hive 元数据库进行初始化。一、重新初始化初始化元数据需要使用cdh hive中的sc

原创 2021-11-05 10:37:59 · 1487 阅读 · 0 评论
【CDH】CDH集群hiveserver2服务频繁挂掉

问题现象：cdh集群 master00节点 hiveserver2服务2小时内挂掉2次，报内存溢出的问题。错误日志如下：问题排查：打印一下堆的gc 信息jstat -gc pid 1000 5堆设置了4g的内存，Eden区只有400M, s0 和 s1区更小，然后剩余的空间都是老年代区，空间配置不合理，重新配置下堆空间。解决方案：设置hiveserver2的jvm参数-Xmn2g -XX:NewRatio=4 -XX:MaxPermSize=512M -XX:+UseParNew

原创 2021-05-27 18:30:03 · 1685 阅读 · 1 评论
[CDH]Timed out waiting for worker process collecting filesystem usage to complete

一、问题描述1. cm监控告警cloudera-manager 触发告警，该主机与 Cloudera Manager Server 失去联系的时间过长。该主机未与 Host Monitor 建立联系。原因多半是cloudera-scm-agent服务挂掉。2. 问题原因那么就来看cloudra-scm-agent是因为什么原因挂掉了，查看日志：vim /var/log/cloudera-scm-agent/cloudera-scm-agent.log搜索ERROR，搜到如下错误： Tim

原创 2021-05-20 10:41:59 · 869 阅读 · 1 评论
[hadoop] Warning: fs.defaultFS is not set when running “ls“ command.

问题现象使用cloudera-manager 新增了两台节点，并在上面部署了Datanode服务，服务部署成功后，并且也添加了Gateway，但是在新增的节点上使用HDFS的命令报错。报错内容Warning: fs.defaultFS is not set when running "ls" command.Found 22 items-rw-r--r-- 1 root root 0 2020-11-03 05:30 /.autorelabeldr-xr-xr-x -

原创 2021-04-19 13:25:08 · 783 阅读 · 0 评论
CDH添加 NFS Gateway 角色实例启动失败问题

环境信息：测试环境版本操作系统centos6.9CDH5.13问题描述往集群中的主机添加角色时，发现HDFS 存在警告信息，其余角色正常。通过查看日志信息，发现 NFS Gateway 这一块出错，错误日志错误日志，具体异常如下：using as SECURE_USERusing as SECURE_GROUPCONF_DIR=/run/cloudera-scm-agent/process/1436-hdfs-NFSGATEWAYCMF_CONF_DIR=

原创 2021-03-25 15:23:22 · 887 阅读 · 1 评论
HUE+kerberos启动报错Couldn‘t renew kerberos ticket

环境信息组件版本操作系统centos6.9CDH5.13kerberos是问题现象HUE+kerberos启动报错Couldn’t renew kerberos ticket解决方案，kt_renewer ERROR Couldn‘t renew kerberos ticket in order to work around Kerberos 1.8.1 issu错误日志日志如下：Couldn't renew kerberos ticket in ord

原创 2021-03-24 16:46:08 · 691 阅读 · 0 评论
CDH 导入KDC Account Manager 凭据失败

环境信息：组件版本cdh版本5.13操作系统版本centos 6.9问题现象：CDH 5.13.3 启用Kerberos组件，导入KDC Account Manager 凭据,未见生成的票据。错误日志：/usr/share/cmf/bin/import_credentials.sh failed with exit code 1 and output of <<+ export PATH=/usr/kerberos/bin:/usr/kerberos

原创 2021-03-18 15:00:38 · 1020 阅读 · 0 评论
CDH集群安装kerberos权限后，JobhistoryServer无法启动

环境信息：组件版本操作系统centos 6.9CDH5.13kerberos环境是问题现象：CDH集群安装kerberos权限后，yarn的JobhistoryServer无法启动。报错日志：Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): Permission denied: user=mapred, a

原创 2021-03-19 10:32:46 · 524 阅读 · 0 评论
cm制作yum镜像源

问题背景：要搭建cm大数据平台，别的节点需要安装cloudera-scm-agent，有因为文件较大，不想分发，所以采用yum源的方式进行安装，避免文件传输，io占用。系统环境：组件版本cdh版本5.13操作系统版本centos 6.9安装HTTPD服务：1.安装httpd服务yum -y install httpd2. 启动httpd服务，并设置开机自启service httpd restart && chkconfig httpd on

原创 2021-03-18 15:52:54 · 279 阅读 · 0 评论

cdh

作者: kiraraLou

【CDP】CDP 集群通过Knox 访问Yarn Web UI，无法跳转到Flink Web UI 问题解决

【knox】Gateway SSL Certificate is Expired. Server will not start

【CDH】cloudera manger 如何开启Debug 日志调试模式

【CDP】Cloudera Manager 记录一次 Service Monitor 内存溢出/使用率高的问题及通用排查方案

【CDP】CDP集群如何通过Cloudera Manager配置使用SNMP方式转发告警

【yarn】CDP集群 Yarn配置capacity调度器批量分配

【CDH】CDH/CDP 环境修改 cloudera manager默认端口7180

【CDH】CDH5.16 配置 yarn 任务集中分配设置不生效问题

【CDH】cloudera mamager中配置hive加载第三方JAR

【CDH】通过 ClouderaManager 配置CDH组件用 prometheus + hbase 监控采集JMX信息

【HIVE】MetaException(message:Error(s) were found while auto-creating/validating the datastore for cla

【CDH】问题解决：CDH5.16重新初始化hive 元数据信息

【CDH】CDH集群hiveserver2服务频繁挂掉

[CDH]Timed out waiting for worker process collecting filesystem usage to complete

[hadoop] Warning: fs.defaultFS is not set when running “ls“ command.

CDH添加 NFS Gateway 角色实例启动失败问题

HUE+kerberos启动报错Couldn‘t renew kerberos ticket

CDH 导入KDC Account Manager 凭据失败

CDH集群安装kerberos权限后，JobhistoryServer无法启动

cm制作yum镜像源