Hbase 问题汇总

最新推荐文章于 2023-09-08 18:14:23 发布

原创最新推荐文章于 2023-09-08 18:14:23 发布 · 566 阅读

0 ·

CC 4.0 BY-SA版权

hadoop 自学指南专栏收录该内容

17 篇文章

订阅专栏

1、ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet

解决：将hadoop1.2.1下的hadoop-core-1.2.1.jar拷贝到hbase-0.98.7-hadoop1/lib下，两文件大小不一致，以hadoop1.2.1为准；

2、启动hbase shell时，报出： Warning: $HADOOP_HOME is deprecated.

解决：在.bash_profile环境变量中，加入：export HADOOP_HOME_WARN_SUPPRESS=1

3、报错：
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/hadoop1/hbase-0.98.7-hadoop1/lib/slf4j-log4j12-1.6.4.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/home/hadoop1/hadoop-1.2.1/lib/slf4j-log4j12-1.4.3.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

解决：将hadoop1.2.1下的slf4j-api-1.4.3.jar、slf4j-log4j12-1.4.3.jar拷贝到hbase-0.98.7-hadoop1/lib下，将原有slf4j*删除。

4、stop-hbase无法停止，检查日志发现等待leave safemode。

解决：启动hadoop时，运行命令：hadoop dfsadmin -safemode leave 确保未处于安全模式。

5、ERROR: Can't get master address from ZooKeeper; znode data == null

解决：这个问题其实有点莫名其妙，原因我暂时还不清楚，可能是文件系统中一些坏的块导致，或者hbase 本身的不稳定，楼主是以下方法解决的

1、删除文件坏的块

hadoop fsck -delete 可以移除 missing block
hadoop fsck -move 会把错误的块信息移到 HDFS 的 /lost+found

2、重启hadoop ,stop-alll.sh；start-all.sh。jps一下，保证所以进程被杀掉，只留下 jps

好吧！成功了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

holo_hai

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

HBase（番外）：常见问题

u013938578的博客

07-01

885

将 hadoop.dll 放到c:/windows/system32文件夹中，重启IDEA，重新运行程序。（1）找到$HADOOP_HOME/etc/mapred-site.xml,增加以下配置。无法连接到HBase，请检查HBase的Master是否正常启动。是因为缺少用户定义造成的，所以分别编辑开始和关闭脚本。（2）将配置文件分发到各个节点。（3）重新启动YARN集群。

HBase常见问题及核心知识点

Tattoo

10-23

508

存储结构 LSM - Log Structured Merge Tree 顺序存储、内存中、flush磁盘读写独立、保证一致的写效率对region的寻址采用了B+树的数据结构 HBase工作流程新的客户端查找某个特定的行键：首先要连接ZooKeeperQurom。从ZooKeeper检索持有-ROOT-Region的服务器名，获得拥有-ROOT-Region的RegionSe...

参与评论您还未登录，请先登录后发表或查看评论

HBase 常见问题集合

Zephyr's Blog

12-30

2070

5.3 Region Server 意外退出报错信息如下： ERROR org.apache.hadoop.hbase.regionserver.HRegionServer: ZooKeeper session expired 之后， regionserver就退出了。

hbase常见问题

weixin_34290390的博客

03-28

263

1、初始化连接错误 2016-03-23 17:54:26,233 ERROR [org.apache.hadoop.hbase.client.HConnectionManager] - <Connection not found in the list, can't delete it (connection key=HConnectionKey{properties={hbase....

hbase问题总结

keyuquan的博客

06-17

2498

hbase启动时： zookeeper 挂掉和 hmaster挂掉的问题 A： zookeeper 挂掉 ERROR [main] zookeeper.ZooKeeperWatcher:hconnection-0x6e1721d7, quorum=hadoop-senior01.ibeifeng.com:2181,baseZNode=/hbase Received unexpected Ke

hbase问题总结(校招)

weixin_42908473的博客

03-08

373

1.hbase的底层 1)StoreFile 保存实际数据的物理文件，StoreFile以HFile的形式存储在HDFS上。每个Store会有一个或多个StoreFile(HFile),数据在每个StoreFile都是有序的。 2)MemStore 写缓存，由于HFile中的数据要求是有序的，所以数据是先存储在MemStore中，排好序后，等到达刷写时机时才会刷写到HFile，每次刷写都会形成一个新的HFile。 3)WAL 由于数据要经MemStore排序后才会刷写到HFile，但把数据保存在内存中会有.

HBase常见问题及调优总结

Dreamershi的专栏

09-15

1760

1. HBase Schema及Rowkey设计 HBase 在实际生产使用中，需要根据具体的业务使用场景，给出相匹配的Rowkey 设计及HBase 表Schema 设计，提升HBase 的使用性能，同时避免出现热点瓶颈问题。 1.1 HBase 表Schema 设计原则在HBase 中有许多不同的数据集，具有不同的访问Schema 级别和服务级别的期望，下面的设计法则只是概述：目标 region 的大小介于10 到50 GB 之间。单个单元格大小不要超过10 MB，如果使用MOB，则为

Python连接hbase错误原因详解

lIujunXHU的博客

09-08

1271

要解决这个问题，你可以将 hbase.regionserver.thrift.http 的值设置为 false，重启 HBase Thrift 服务，并使用 HappyBase 基于 Thrift 协议进行连接和数据操作。由于 HappyBase 是基于原生的 Thrift 协议实现的 Python 客户端库，它不直接支持通过 HTTP 进行连接和读取数据。因此，如果你在 HappyBase 中尝试通过 HTTP 访问 HBase Thrift 服务，可能会导致无法读取数据的问题。

Hbase学习总结.rar

02-07

**HBase学习总结** HBase，全称是Apache HBase，是一个分布式的、面向列的开源数据库，它是基于Google的Bigtable模型构建的，专为处理海量数据而设计。HBase是Apache Hadoop生态系统的一部分，它运行在Hadoop分布式...

Hbase个人总结

01-27

### HBase概述与基础知识 #### 一、HBase与OLTP及OLAP 在大数据处理领域，企业常常面临着两种不同的数据处理需求：联机事务处理（OLTP）和联机分析处理（OLAP）。OLTP通常涉及频繁的更新、插入和删除操作，而OLAP...

flinkSQL写入hbase问题汇总

东城庞太师

09-08

3180

问题一：Expression 'pay_acct_no' is not being grouped 解决：检查下group by 的字段是否正确问题二：要插入的列和hbase的列不匹配. 解决：注意ROW(),与hbase保持一致。

spark操作hbase的问题汇总

12-03

845

1.无法访问hbase的regionservice 自己就在虚拟机里搭建了Hadoop和HBase，在进行API操作连接时，出现以下错误： Exception in thread "main" org.apache.hadoop.hbase.client.RetriesExhaustedException: Failed after attempts=36, exceptions: Fri N...

Hbase 常见问题

csdn问鼎

07-25

481

Master 在hbase中的角色分配region给region server,和regionserver的负载均衡 zookeeper在hbase中的角色存储配置信息，分布式同步，负责客户端和region server交流 hregionserver在hbase中的角色响应数据读写，管理region hbase cataglog tables Meta表，里面包含所以region和他们的位置信息 Hhbase write/write 读路径-memstore(写缓存)—>blockcache(

Hbase常见问题

caoyongfei

07-11

847

Hbase常见问题

Hbase常见问题收集

blacklau的专栏

04-13

689

1、drop 表后，会现 hadoop.hbase.catalog.MetaReader - No serialized HRegionInfo in keyvalues的警告，通过命令修复： hbase hbck -fixEmptyMetaCells

HBase 常见问题总结（一）

Shockang的博客

11-13

1671

问题一：业务表出现大量空Region 问题二：业务 HBase 客户端 RPC 连接异常关闭问题三：单台 RegionServer 的 I/O 使用率一直为100%，HBase 集群请求量为0

HBase常见问题解答

hua840812的专栏

04-05

1015

目前NoSQL产品最被人诟病的就是其稳定性，不得不承认，目前HBase离做到数据库那样的高稳定还有距离(丢数据、不能读写、DDL失败等严重问题)，这篇blog将用来记录我们在运维HBase时碰到的问题(会不断更新)，希望能给使用HBase的同学有一些帮助。　　1、单台regionserver的region数很多后写速度疯狂下降　　具体请见：http://koven2049.itey

Hbase 优化问题

最新发布

10-21

<think>我们正在讨论HBase优化问题的解决方案。根据用户提供的引用和之前的讨论，我们需要整理HBase优化的关键点。用户引用了三处来源：引用[1]：提到了RegionServer崩溃的问题（未完整给出）以及性能优化的一些方向。引用[2]：详细说明了HBase性能优化的策略，包括硬件配置、GC优化、数据分布、分区设计，以及解决性能问题的方法（扩容、参数优化、负载均衡、JVM配置）。引用[3]：展示了一个具体的JVM参数优化例子（GC日志打印和CMS垃圾回收器的设置）。用户需求是：查找HBase优化问题的解决方案或信息。因此，我们的回答应围绕HBase性能优化展开，涵盖以下几个方面： 1. 硬件和配置优化（内存、磁盘等） 2. JVM优化（GC设置） 3. 数据设计和负载均衡（RowKey设计、分区设计、避免热点） 4. 参数调优（memstore、块缓存、压缩等） 5. 集群扩展（扩容RegionServer） 6. 使用工具（如YARN）同时，按照用户要求： - 回答结构清晰，逐步解决问题。 - 使用中文。 - 在引用处添加引用标识，如[^2]。 - 生成相关问题。注意：引用[1]中关于RegionServer崩溃的问题描述不完整，但我们知道RegionServer崩溃是常见问题，通常与内存不足、GC问题等有关，所以我们在优化中会涵盖这些内容。另外，用户提供的引用[3]是一个具体的JVM参数设置示例，我们可以在JVM优化部分引用。回答结构建议： 1. 引言：简要说明HBase优化的重要性。 2. 分点列出优化策略，每个策略下给出具体方法和建议。 3. 每点中适当引用用户提供的引用内容。 4. 最后给出总结和相关问题。由于引用内容有限，我们主要基于引用[2]展开，因为它提供了较全面的优化指南，并补充引用[3]的JVM配置实例。具体优化点（根据引用[2]）： 1. 硬件配置：内存、磁盘。 2. GC优化：调整GC参数，如使用CMS，设置合适的堆大小和GC间隔。 3. 数据分布：避免热点，设计良好的RowKey和分区。 4. 参数优化：memstore大小、块缓存大小、压缩算法等。 5. 负载均衡策略：如随机负载均衡。 6. 扩容：增加RegionServer节点。我们还将引用[3]的具体JVM参数示例放在GC优化部分。注意：引用[1]中提到了RegionServer崩溃，但是没有给出具体描述，我们可以将其与GC问题或硬件不足联系起来，在相应的优化部分提及。最后，生成3-5个相关问题。 </think>### HBase优化问题全面解决方案以下针对HBase常见性能瓶颈，结合官方最佳实践与生产经验，提供系统性优化方案： --- #### 一、硬件与配置优化 1. **内存管理** - **RegionServer堆内存**：推荐设置为集群总内存的70%-80%（如64GB物理内存配45GB堆）[^2] - **块缓存(BlockCache)**：占用堆内存40%，使用BucketCache off-heap模式避免Full GC ```xml  <property> <name>hfile.block.cache.size</name> <value>0.4</value>  </property> <property> <name>hbase.bucketcache.size</name> <value>40960</value>  </property> ``` 2. **GC调优** - 启用CMS+ParNew组合，避免STW停顿超过200ms[^3]： ```bash export HBASE_OPTS="$HBASE_OPTS -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70" ``` - 监控GC日志：关注`Full GC`频率，超过1次/小时需扩容内存[^2] --- #### 二、数据模型优化 1. **RowKey设计原则** - **散列热点**：对单调递增RowKey添加哈希前缀，如`MD5(user_id)_timestamp` - **长度控制**：不超过16字节，满足$$ \text{存储效率} \propto \frac{1}{\text{RowKey长度}} $$ 2. **分区均衡** - 预分区避免Region分裂延迟：创建表时指定`SPLITS` ```bash create 'orders', 'cf', {NUMREGIONS => 15, SPLITALGO => 'HexStringSplit'} ``` - 监控`hbase:meta`表，确保Region大小均匀（推荐10-20GB/Region）[^2] --- #### 三、读写性能优化 | **参数** | **优化值** | **作用** | |--------------------|------------------|------------------------------| | hbase.hstore.blockingStoreFiles | 20 | 控制Compaction触发阈值 | | hbase.hregion.memstore.flush.size | 256MB | 降低MemStore刷写IO压力 | | hbase.regionserver.handler.count | 256 | 提升并发请求处理能力 | 1. **写入优化** - 批量写入：使用`Put.setDurability(Durability.SKIP_WAL)`跳过WAL（允许数据丢失场景） - 压缩算法：启用Snappy压缩$$ \text{压缩比} \approx 60\% \sim 80\% $$[^2] ```xml <property> <name>hbase.regionserver.codecs</name> <value>snappy</value> </property> ``` 2. **查询优化** - **布隆过滤器**：对随机读场景启用`ROW`模式 ```java HColumnDescriptor.setBloomFilterType(BloomType.ROW); ``` - **批量Scan**：设置`setCaching(1000)`减少RPC次数 --- #### 四、集群运维优化 1. **水平扩展** - RegionServer数量公式：$$ N = \frac{\text{总数据量}}{\text{单节点内存上限}} \times 1.2 $$ - 添加节点后执行`balance_switch true`触发负载均衡[^2] 2. **监控指标** | **关键指标** | **健康阈值** | **优化动作** | |----------------------------|--------------------|----------------------------| | CompactionQueueSize | < 20 | 增加`hbase.hstore.thread.compaction.large` | | MemStoreSize | < 80%堆内存 | 调低flush.size或扩容内存 | | BlockCacheHitRatio | > 95% | 增大缓存比例 | --- ### 总结优化路径 ```mermaid graph LR A[性能瓶颈分析] --> B{问题类型} B -->|写入慢| C[优化MemStore/WAL] B -->|查询慢| D[调整BlockCache/布隆过滤器] B -->|节点热点| E[RowKey散列+预分区] C --> F[参数调优] D --> G[查询模式改造] E --> H[负载均衡] ``` --- ### 相关问题 1. RegionServer频繁Full GC如何定位和解决？ 2. HBase如何实现热点Region的动态分裂与合并？ 3. 如何设计RowKey以同时支持范围扫描和高并发写入？ 4. HBase与Spark集成时有哪些性能调优关键点？ > 建议通过`hbase shell`执行`status 'detailed'`持续监控集群状态，并结合Grafana+Prometheus实现实时指标分析[^2]。