什么时候才应该使用HBase？

何时使用HBase：数据量与系统设计考量

最新推荐文章于 2025-04-17 14:37:47 发布

原创最新推荐文章于 2025-04-17 14:37:47 发布 · 3.4k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hbase #数据库 #jdbc #工作 #服务器 #集群

HBase 专栏收录该内容

1 篇文章

订阅专栏

本文探讨了何时适合使用HBase作为数据存储解决方案，包括数据规模要求、系统架构兼容性及硬件资源考量。重点在于理解HBase在处理大量数据时的优势与局限。

什么时候才应该使用HBase？

张贵宾

guibin.beijing@gmail.com

在使用HBase一定要明白HBase的适用场合，因为HBase并非适用于每种情况。

首先，要确认有足够多的数据存入HBase。

如果有几亿或者几十亿条记录要存入HBase，那么HBase就是一个正确的选择；否则如果你仅有几百万条甚至更少的数据，那么HBase当然不是正确的选择，这种情况下应当选择传统的关系型数据库，因为如果这么少的数据存入HBase，就会导致数据堆积在一两个节点上，而HBase集群内部的其他节点都处于空闲状态。

其次，要确认即便不使用传统关系型数据库提供的额外功能（比如数据库的列有强类型限制，secondary index，transaction，SQL等高级查询语言）系统也能顺畅工作。

基于传统关系型数据上的应用不能通过简单的更换JDBC驱动程序"迁移"到HBase。系统从普通的关系型数据库迁移到HBase将导致整个系统的重新设计。

最后，确认有足够的硬件服务器来支撑HBase的运行。

即便单独运行HDFS，HDFS在少于5个节点的情况下工作不理想，由于在默认情况下HDFS的block replication factor为3，另外还要加上一个Namenode。

参考资料：http://hbase.apache.org/book.html#arch.overview

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。