
hadoop运维
文章平均质量分 82
hadoop安装、使用过程中的问题
roman_日积跬步-终至千里
做三四月的事,在八九月自有答案。
展开
-
【YARN运维】Yarn常见任务shell运维命令:集群状态、查看任务、任务日志
【YARN运维】Yarn常见任务shell运维命令:集群状态、查看任务、任务日志原创 2024-03-30 15:23:11 · 1396 阅读 · 0 评论 -
【大数据运维】minio 常见shell操作
【大数据运维】minio 常见shell操作原创 2024-03-28 17:54:42 · 766 阅读 · 0 评论 -
【大数据运维】大数据常见shell命令
【大数据运维】大数据常见shell命令原创 2024-03-05 16:42:03 · 632 阅读 · 0 评论 -
【运维】yarn高可用配置详解
>本文主要描述了:>1. yarn HA架构细节:active/standby、故障转移的方式、故障转移客户端> 2. 怎么恢复之前提交的任务> 3. 怎么部署配置YARN HA> 4. 手动切换主备原创 2024-01-02 18:16:33 · 1559 阅读 · 0 评论 -
【HDFS运维】HDFS回收箱机制:原理、配置、配置可能导致的问题分析
【HDFS运维】HDFS回收箱机制:原理、配置、配置可能导致的问题分析原创 2023-12-05 15:47:13 · 1340 阅读 · 2 评论 -
【解决】HDFS JournalNode启动慢问题排查
集群启动慢排查原创 2023-11-23 18:44:50 · 1482 阅读 · 0 评论 -
【解决】hive on yarn 任务启动失败:JDWP Transport dt_socket failed to initialize,TRANSPORT_INIT(510)
【解决】hive on yarn 任务启动失败:JDWP Transport dt_socket failed to initialize,TRANSPORT_INIT(510)原创 2023-11-22 10:19:28 · 958 阅读 · 0 评论 -
【hadoop运维】running beyond physical memory limits:正确配置yarn中的mapreduce内存
【hadoop运维】running beyond physical memory limits:正确配置yarn中的mapreduce内存原创 2023-09-03 17:14:37 · 1769 阅读 · 0 评论 -
【运维】hadoop 集群安装(三)hdfs、yarn集群配置、nodemanager健康管理讲解
【运维】hadoop 集群安装(三)hdfs、yarn集群配置、监控nodemanager配置原创 2023-08-30 18:37:27 · 1583 阅读 · 0 评论 -
【运维】hadoop3.0.3集群安装(二) 横向新增节点和删除节点
横向新增hadoop节点原创 2023-08-30 10:18:57 · 1036 阅读 · 0 评论 -
【运维】hadoop3.0.3集群安装(一)多节点安装
hadoop集群安装原创 2023-08-27 20:03:14 · 407 阅读 · 0 评论 -
【hadoop】Connection Refused的排查方案
【代码】【hadoop】Connection Refused的排查方案。原创 2023-05-17 14:07:38 · 970 阅读 · 0 评论 -
【运维】Hadoop集群异常:两个NameNode全部为StandBy状态
active节点通过zkfc将状态写到zk中,standBy对此状态感兴趣添加监听,当active宕机,zkfc立即通知standy转换为active。namenode的高可用是zk维护实现的,可以尝试初始化namenode在zookeeper的元数据。当zkfc挂掉之后,这些namenode节点状态则不能维护和相互同步,就有可能都为standy。重启zkfc之后namenode正常。...原创 2022-08-04 22:45:00 · 2210 阅读 · 2 评论 -
【运维与安装】Hadoop 3.3.1 :Setting up a Single Node Cluster.
最近公司搞国产化,项目里用到的hadoop 2.10.1版本 不支持国产化,hadoop 3.1.1 版本支持ARM架构的国产CPU。hadoop的版本修改势必会影响项目里对API、restfulAPI、flink with hadoop相关,所以本地先搭建一个hadoop 3.1.1 测试一下版本升级对项目的影响。参考官网搭建一个本地的hadoop。...原创 2022-08-12 18:26:03 · 661 阅读 · 0 评论 -
【基础-配置文件】:hadoop配置文件作用概述ing
通过了解hadoop各配置文件的含义,帮助理解job提交到yarn集群失败时的相关排查、以及job提交时相关配置参考。原创 2022-08-17 14:42:16 · 2124 阅读 · 0 评论 -
【配置/认证】Authentication for Hadoop(3.3.1) HTTP web-consoles : Hadoop的simple认证 不是银弹
Authentication for Hadoop HTTP web-consoles原创 2022-08-22 10:12:30 · 1456 阅读 · 0 评论 -
【排错与运维】hadoop-3.3.1 HDFS中出现 Operation category JOURNAL is not supported in state standby
namenode主备切换时,因为zkfc所需空间不足,导致不能提供主备切换服务,导致HDFS出现问题。解决方案:在zkfc所在机器下,清理无用空间,然后重新启动zkfc 和 hdfs 即可。原创 2022-08-19 14:29:44 · 998 阅读 · 0 评论 -
【运维与配置】Hadoop(3.3.1): Capacity Scheduler:通过设置资源队列来满足不同业务之间的资源隔离、队列的弹性以及队列权限
通过设置yarn的资源队列,可以实现不同业务的资源隔离,同时设置队列的弹性范围,以便在某个队列资源紧张时,可以使用其他队列的资源。原创 2022-08-25 11:32:21 · 1266 阅读 · 0 评论 -
【排错】记一次(flink on yarn) 提交任务的排错之旅(yarn队列、namenode、resourcemanager、flink job全崩盘)
为了支持国产化环境,需要升级hadoop到3.3.1版本,升级好后提交flink(1.12.5)任务还发现问题不少,一个个排查吧。原创 2022-08-26 11:40:40 · 1178 阅读 · 0 评论 -
【运维与安装】hadoop 3.3.1 高可用 + simple认证 +队列设置
本文通过配置hadoop相关文件实现HDFS、YARN的集群以及高可用。其他例如:队列配置、simple安全认证等见我的其他文章。原创 2022-08-30 18:34:46 · 1115 阅读 · 0 评论 -
【分析思路】hadoop 3.3.1 bug修复:failed with status code 401 Response message: Authentication required
为了支持国产化,hadoop需要安装3.3.1版本,而客户这边需要安全认证,所以对于hadoop需要做的事是升级到3.3.1版本、支持HA模式、安全认证。本文关注hadoop升级过程、启动中出现的401权限问题。原创 2022-09-05 21:37:18 · 1385 阅读 · 0 评论 -
【修改源码】hadoop 3.3.1 failed with status code 401 Response message: Authentication required
本文主要通过修改源码解决hadoop内部通讯鉴权的问题。原创 2022-09-19 16:00:07 · 1544 阅读 · 4 评论 -
【排错/运维】修复HDFS丢失、损坏以及副本数的问题
【排错/运维】修复HDFS丢失、损坏以及副本数的问题原创 2022-09-30 10:54:53 · 4620 阅读 · 0 评论