
cdh
文章平均质量分 57
kiraraLou
这个作者很懒,什么都没留下…
展开
-
【CDP】CDP 集群通过Knox 访问Yarn Web UI,无法跳转到Flink Web UI 问题解决
记录下在CDP 环境中,通过Knox 访问Yarn Web UI,无法跳转到Flink Web UI 的BUG 解决方法。原创 2023-12-12 16:28:57 · 544 阅读 · 0 评论 -
【knox】Gateway SSL Certificate is Expired. Server will not start
今天 KNOX 突然无法启动,报错日志与证书过期有关。原创 2023-05-11 11:35:52 · 688 阅读 · 0 评论 -
【CDH】cloudera manger 如何开启Debug 日志调试模式
在安装 Cloudera Manger 时,遇到报错,需要开启Debug 日志级别来排查下问题原因。这里记录下 CM 如何开启 Debug 级别。原创 2023-03-22 17:19:40 · 584 阅读 · 0 评论 -
【CDP】Cloudera Manager 记录一次 Service Monitor 内存溢出/使用率高的问题及通用排查方案
通过了解 Servcie Monitor 具体的监控指标项,以及每个监控指标项对应的监控 Entity 的数量,来判断是那个监控指标项引起的Service monitor 内存使用率过高。开始的时候,没有过多考虑,只是增加了 JVM 的堆内存大小,但是过段时间有出现,从 16G -> 32G -> 64G,问题还是没有解决,看来必须更深的追一下了。找到监控实体数量最多的一项,问题大概就是由他引起的,可能每个人的情况不一样,这里只给一个通用的排查方向,具体的情况具体解决。滚动重启 Kafka 集群。原创 2023-01-09 11:12:34 · 1940 阅读 · 0 评论 -
【CDP】CDP集群如何通过Cloudera Manager配置使用SNMP方式转发告警
这篇文章参考了大神的文章,如何在CDH平台上集成SNMP服务,然后实现了CDP集群集成SNMP服务,这里描述下,如何集成步骤,在CDP集群中告警是一个很重要的信息,最直观的衡量一个集群的健康状况,那么我们如何来管理集群的告警信息?通过Cloudera Manager来管理的CDP集群,提供了多种告警管理方式(如:邮件、SNMP及自定义告警脚本),本篇文章主要介绍如何通过Cloudera Manager配置使用SNMP方式转发告警。原创 2023-01-03 17:15:11 · 930 阅读 · 0 评论 -
【yarn】CDP集群 Yarn配置capacity调度器批量分配
最近要升级 集群成 集群,CDH 集群中 Yarn 服务默认使用的是 Fa 调度器,CDP 集群使用的是 调度器,我们之前淌过 调度器因为批量分配设置不合理,导致任务集中分配到了某几台节点,使集群资源负载极度不均衡。为了避免同样的问题出现在 CDP 集群上,我们提前进行调研。看看使用 调度器会不会也有集中分配的现象。但是调研过程中,出现了一些不和预期的现象,等待后续跟进。前面介绍过, 版本后,针对,有如下几个配置,来针对任务类型(小任务)加快分配的优化。通过合理的配置,我们就可以即使用集中分配的方式,又原创 2022-07-01 16:50:24 · 1341 阅读 · 0 评论 -
【CDH】CDH/CDP 环境修改 cloudera manager默认端口7180
最近在配合下游搭建 环境的集群,由于测试方为云环境,并且要求外网 端口只能使用 以上,所以 需要修改,由于 界面无法打开,所以只能通过修改元数据库,这里我使用的元数据库是MySql。2. 切换数据库(CM的元数据库)3. 查看 表数据结果如下:4. 对 表新增 配置新增查看是否新增成功5. 修改后重启 cloudera-scm-server6. 查看端口是否修改成功修改成功!.........原创 2022-06-13 11:49:41 · 1902 阅读 · 0 评论 -
【CDH】CDH5.16 配置 yarn 任务集中分配设置不生效问题
前言记录下 CDH 集群 yarn 服务任务集中分配配置不生效问题。环境信息CDH 5.16Hadoop 2.6.0yarn 为公平调度模式问题经过近日,系统运维反馈说我们的大数据集群有一个节点(nodemanager)内存使用率超过报警阈值,触发告警。排查后发现计算节点(nodemanager)与节点(nodemanager)的负载差距较大,当即就想到了是因为 Yarn 开启了批量分配导致的。加之由于我们的任务都是流式计算任务,单个任务需要用到的 container 数量不多。所以更原创 2022-05-26 13:10:41 · 1153 阅读 · 0 评论 -
【CDH】cloudera mamager中配置hive加载第三方JAR
前言再将 hbase 导入 hive 表时,出现行数远远大于实际的数量,排查后发现是hbase 数据中有很多换行, 所以需要使用第三方的jar 的行分隔符。这里使用了自定义的jar包。永久添加这时想要使用jar 包每次都需要手动添加,然后才能使用。这里我们使用永久添加的方式。配置Hive 辅助 JAR 目录 设置 /opt/cloudera/parcels/CDH/lib/hive/auxlibhive-env.sh 的 Gateway 客户端环境高级配置代码段(安全阀) 设置 HIVE原创 2022-03-21 14:43:32 · 2143 阅读 · 0 评论 -
【CDH】通过 ClouderaManager 配置CDH组件用 prometheus + hbase 监控采集JMX信息
前言最近需要在 cloudera manager 监控界面对CDH 的组件来用 prometheus 监控。也参考了很多网上的资料,目前很多都是修改的后台配置文件,目前测试下来,如果通过 cloudera manager 来启动服务,感觉配置没有生效。这里采用在 cloudera manager 监控界面配置参数的方式,已经测试通过。这里整理并记录一下。具体实践这里以 Hbase 服务为例。来进行我们配置,别的组件参考即可。依赖组件需要用到的服务有prometheusgrafanajmx_原创 2022-03-10 11:43:25 · 3613 阅读 · 0 评论 -
【HIVE】MetaException(message:Error(s) were found while auto-creating/validating the datastore for cla
问题原因:hive 元数据库信息有问题。解决方法:重新初始化元数据库。CDH集群初始化hive 元数据库 参考如下:https://blog.youkuaiyun.com/Mrerlou/article/details/121157908原创 2021-11-05 14:49:31 · 897 阅读 · 0 评论 -
【CDH】问题解决:CDH5.16重新初始化hive 元数据信息
文章目录前言一、重新初始化二、操作步骤1.脚本位置2.执行命令3. 执行报错4. 问题原因:5. 解决方案:6. 重新初始化转载:前言之前在搭建CDH集群时,在进行到初始化hive 元数据库时,由于DBA没有放开库所有的权限,导致当时初始化hive元数据信息部分失败。由于集群当时能够正常使用,于是就没有做过多的考虑,今天在创建hive udf时报错,排查下来是当时初始化表时,缺失了几张表。于是决定重新对hive 元数据库进行初始化。一、重新初始化初始化元数据需要使用cdh hive中的sc原创 2021-11-05 10:37:59 · 1487 阅读 · 0 评论 -
【CDH】CDH集群hiveserver2服务频繁挂掉
问题现象:cdh集群 master00节点 hiveserver2服务2小时内挂掉2次,报内存溢出的问题。错误日志如下:问题排查:打印一下堆的gc 信息jstat -gc pid 1000 5堆设置了4g的内存,Eden区只有400M, s0 和 s1区 更小,然后剩余的空间都是老年代区,空间配置不合理,重新配置下堆空间。解决方案:设置hiveserver2的jvm参数-Xmn2g -XX:NewRatio=4 -XX:MaxPermSize=512M -XX:+UseParNew原创 2021-05-27 18:30:03 · 1685 阅读 · 1 评论 -
[CDH]Timed out waiting for worker process collecting filesystem usage to complete
一、问题描述1. cm监控告警cloudera-manager 触发告警,该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系。原因多半是cloudera-scm-agent服务挂掉。2. 问题原因那么就来看cloudra-scm-agent是因为什么原因挂掉了,查看日志:vim /var/log/cloudera-scm-agent/cloudera-scm-agent.log搜索ERROR,搜到如下错误: Tim原创 2021-05-20 10:41:59 · 869 阅读 · 1 评论 -
[hadoop] Warning: fs.defaultFS is not set when running “ls“ command.
问题现象使用cloudera-manager 新增了两台节点,并在上面部署了Datanode服务,服务部署成功后,并且也添加了Gateway,但是在新增的节点上使用HDFS的命令报错。报错内容Warning: fs.defaultFS is not set when running "ls" command.Found 22 items-rw-r--r-- 1 root root 0 2020-11-03 05:30 /.autorelabeldr-xr-xr-x -原创 2021-04-19 13:25:08 · 783 阅读 · 0 评论 -
CDH添加 NFS Gateway 角色实例启动失败问题
环境信息:测试环境版本操作系统centos6.9CDH5.13问题描述往集群中的主机添加角色时,发现HDFS 存在警告信息,其余角色正常。通过查看日志信息,发现 NFS Gateway 这一块出错,错误日志错误日志,具体异常如下:using as SECURE_USERusing as SECURE_GROUPCONF_DIR=/run/cloudera-scm-agent/process/1436-hdfs-NFSGATEWAYCMF_CONF_DIR=原创 2021-03-25 15:23:22 · 887 阅读 · 1 评论 -
HUE+kerberos启动报错Couldn‘t renew kerberos ticket
环境信息组件版本操作系统centos6.9CDH5.13kerberos是问题现象HUE+kerberos启动报错Couldn’t renew kerberos ticket解决方案,kt_renewer ERROR Couldn‘t renew kerberos ticket in order to work around Kerberos 1.8.1 issu错误日志日志如下:Couldn't renew kerberos ticket in ord原创 2021-03-24 16:46:08 · 691 阅读 · 0 评论 -
CDH 导入KDC Account Manager 凭据失败
环境信息:组件版本cdh版本5.13操作系统版本centos 6.9问题现象:CDH 5.13.3 启用Kerberos组件,导入KDC Account Manager 凭据,未见生成的票据。错误日志:/usr/share/cmf/bin/import_credentials.sh failed with exit code 1 and output of <<+ export PATH=/usr/kerberos/bin:/usr/kerberos原创 2021-03-18 15:00:38 · 1020 阅读 · 0 评论 -
CDH集群安装kerberos权限后,JobhistoryServer无法启动
环境信息:组件版本操作系统centos 6.9CDH5.13kerberos环境是问题现象:CDH集群安装kerberos权限后,yarn的JobhistoryServer无法启动。报错日志:Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): Permission denied: user=mapred, a原创 2021-03-19 10:32:46 · 524 阅读 · 0 评论 -
cm制作yum镜像源
问题背景:要搭建cm大数据平台,别的节点需要安装cloudera-scm-agent,有因为文件较大,不想分发,所以采用yum源的方式进行安装,避免文件传输,io占用。系统环境:组件版本cdh版本5.13操作系统版本centos 6.9安装HTTPD服务:1.安装httpd服务yum -y install httpd2. 启动httpd服务,并设置开机自启service httpd restart && chkconfig httpd on原创 2021-03-18 15:52:54 · 279 阅读 · 0 评论