hbase空间清理

最新推荐文章于 2024-08-04 03:28:17 发布

原创最新推荐文章于 2024-08-04 03:28:17 发布 · 9.1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#hbase

hbase 专栏收录该内容

1 篇文章

订阅专栏

当HBase因未设置TTL导致磁盘空间占满时，可通过设置表的TTL来自动删除过期数据并释放空间。在清理过程中遇到连接拒绝问题，可能是regionserver异常。重启HBase并释放磁盘空间可解决问题。此外，直接删除HDFS中的HBase文件是一种暴力清理方式，但可能有风险。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

hbase空间清理

hbase由于未设置TTL，导致磁盘空间占满，需要删除数据，或设置TTL。
查看磁盘空间占用情况：

$ df -m

查看磁盘空间占用情况：

$ du -sh *

最终发现是hadoop文件夹占用最高，确切说是./hadoop/tmp/dfs/data文件夹占空间最大。
根据我们自己的业务情况，容易判断出是hbase不断写入导致的问题，通过查看hdfs得到验证：

$ ./hadoop fs -du -h /
12.9 G  /hbase
78.3 K  /tmp

设置hbase表的TTL, 30天

$ ./hbase shell
hbase> desc 'ns1:t1'
hbase> disable 'ns1:t1'
hbase> alter 'ns1:t1', {NAME => 'n1', TTL => '2592000'}, {NAME => 'n2', TTL => '2592000'}
hbase> enable 'ns1:t1'

设置成功后，hbase自动将过期数据删除，进行合并region操作。磁盘空间得以释放。

遇到问题

Connection refused

与网上查到的问题不太一样，我碰到的问题现状是hbase shell可以正常启动，执行list命令OK，但是执行desc命令时就报错Connection refused
查看hbase日志，发现hbase-xxx-regionserver-xxx.log日志中，显示regionserver有异常。

org.apache.hadoop.ipc.RemoteException(java.io.IOException): File xxx could only be replicated to 0 nodes instead of minReplication (=1).  There are 1 datanode(s) running and no node(s) are excluded in this operation.

这个异常没有仔细定位，感觉同样是因为资源占满问题导致的。查看hbase的进程，果然只有master，没有regionserver。