
hadoop
文章平均质量分 73
走向自由
追随自己内心的声音,走向自由。
展开
-
CDH HDFS 概念集合
Maintenance Mode节点进入维护模式,不再接受写入请求,临时离开下很快回来。基本不转移节点上的数据(除非其他节点上都没有该数据副本)需要很短时间。HDFS Maintenance State_Android路上的人的博客-优快云博客前言初一看文章标题,很多人可能比较奇怪“HDFS Maintenance”是什么意思,“HDFS包含”的意思?首先Maintenance这个形似Maintain的单词可不是什么包含的意思,它的解释是维护,维修。那么HDFS Maintenance具体是什原创 2022-04-14 17:07:06 · 2287 阅读 · 0 评论 -
[CDH运维] CDH官方包收费之后
异常:添加一个新节点时,突然发现不能下载包了https://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.15.0/repodata/repomd.xml401 未授权。原因:从2021年1月31日开始,所有Cloudera软件都需要有效的订阅,并且只能通过付费墙进行访问。解决方案:用下面的库代替clouder官方库http://ro-bucharest-repo.bigstepcloud.com/cloudera-repos/cm5/r..转载 2021-05-11 17:07:37 · 4503 阅读 · 3 评论 -
【Hadoop运维】Decommission & Maintenance Mode
Decommission让中心控制节点获知当前节点为即将下线节点,使其从服务节点列表中剔除出去,不让数据读写请求转发到此节点来。 复制当前下线节点中的所有副本数据到其它节点中,保持数据的冗余度。适用于长时间不能提供服务的节点。Maintance Mode让中心控制节点获知当前节点为即将下线节点,使其从服务节点列表中剔除出去,不让数据读写请求转发到此节点来。适用于短时间不能提供服务且至少有一个副本可以提供服务的节点。参考:https://www.cnblogs.com/...转载 2021-05-08 11:02:16 · 444 阅读 · 0 评论 -
HDFS rebalancer Exception: Another Balancer is running..
转载来自:公众号"Hadoop足迹"(微信号:gh_606ce9db5c8e)作者:罗康1.文档编写目的本文主要讲述如何解决HDFS运行Balancer提示“Another Balancer is running..”导致Balancer失败的问题。 测试环境: 1.操作系统版本为Redhat7.22.CM和CDH版本为5.11.23.HDFS已启用HA 文章目录结构: 1.文档编写目的2.问题描述3.解决方案3.1问题解...转载 2021-04-19 11:27:59 · 643 阅读 · 0 评论 -
【运维篇】HDFS磁盘选择策略详解
在 HDFS 中,DataNode 将数据块存储到本地文件系统目录中,具体的目录可以通过配置 hdfs-site.xml 里面的 dfs.datanode.data.dir 参数。在典型的安装配置中,一般都会配置多个目录,并且把这些目录分别配置到不同的设备上,比如分别配置到不同的HDD(HDD的全称是Hard Disk Drive)和SSD(全称Solid State Drives,就是我们熟悉的固态硬盘)上。当我们往 HDFS 上写入新的数据块,DataNode 将会使用 volume 选择策略来为这转载 2021-04-16 18:18:20 · 1130 阅读 · 0 评论 -
Hadoop集群hdfs添加磁盘操作
Hadoop集群hdfs添加磁盘操作目前的环境是cdh。服务器部署在Azure;一台cdhmaster(一个namenode,一个datanode),四台cdhslave节点(各一个datanode)。hdfs现状:首先是在Azure控制台对每台服务器添加一块磁盘(我这添加的是4T)在到服务器中对每台服务器进行添加磁盘操作:因为在Linux中,常用2种分区表:MBR分区表(即主引导记录) 所支持的最大分区:2T,而且对分区有限制:最多4个主分区或3个主分区加一个扩展分区[..转载 2021-04-14 16:25:39 · 1183 阅读 · 0 评论 -
HDFS Rebalance 介绍
原文:https://blog.youkuaiyun.com/xiaofei0859/article/details/49763705HDFS中的数据按照一定策略分布在集群中的多个数据节点上,但在某些情况下,数据的分布也会出现不均衡的情况,比如说集群新增加了节点,在新增加的节点上就没有数据存在,虽说之后新增的数据会分配到新节点上,不过,对于已有数据,新节点和原有节点上的分布很不均衡,而且这还会导致在分配MapReduce任务的时候新机器分配不到可执行的任务分配,白白浪费了新增节点的计算能力。而对于一个真实的生.转载 2021-04-14 11:09:19 · 1028 阅读 · 0 评论 -
【大数据环境篇一】 Hadoop 本地环境搭建概述
本环境篇系列,只记录安装步骤和配置文件等信息,不讲解碰到的问题。Hadoop 2.10.0安装HDFS配置文件etc/hadoop/core-site.xml<configuration> <property> <name>fs.defaultFS</name> <...原创 2020-03-17 23:05:05 · 199 阅读 · 0 评论 -
使用HFileOutputFormat2进行HBase bulk load时的常见错误
最近在用HFileOutputFormat2进行HBase bulk load数据时出现了以下错误,记录下供有相同错误的童鞋们查阅。异常1:java.io.IOException: Mkdirs failed to create /user/adorechen/hbase-stagingException in thread "main" java.io.IOExceptio...原创 2017-12-31 17:42:28 · 7232 阅读 · 5 评论 -
java.lang.NullPointerException at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.init
最近在使用Hbase MultitableInputFormat多表输入时发生下面错误:Unable to initialize MapOutputCollector org.apache.hadoop.mapred.MapTask$MapOutputBufferjava.lang.NullPointerException at org.apache.hadoop.mapred.M原创 2017-12-29 16:13:08 · 3280 阅读 · 0 评论 -
Zookeeper集群节点数量为什么要是奇数个?
文章来源:https://blog.youkuaiyun.com/u010476994/article/details/79806041无论是公司的生产环境,还是自己搭建的测试环境,Zookeeper集群的节点个数都是奇数个。至于为什么要是奇数个,以前只是模糊的知道是为了满足选举需要,并不知道详细的原因。最近重点学习zookeeper,了解到其中的原理,现将其整理记录下来。首先需要明确zookeepe...转载 2018-09-20 17:54:36 · 6038 阅读 · 9 评论 -
hadoop 本地环境搭建
0. 安装版本hadoop version:2.10.0run mode: Pseudo-Distributed1. 安装依赖 Java™ must be installed. Recommended Java versions are described atHadoopJavaVersions. ssh must be installed and sshd ...原创 2020-03-01 17:55:35 · 229 阅读 · 0 评论