HBase 是基于 Hadoop HDFS 构建的分布式、列式存储的 NoSQL 数据库,适用于存储和检索超大规模的非结构化数据。它支持随机读写,并且能够处理 PB 级数据。HBase 通常用于实时数据存取场景,与 Hadoop 生态紧密集成。
使用 HBase 的 Java 示例
前置条件
- HBase 集群:确保 HBase 集群已经安装并启动。如果没有,你可以通过本地伪分布模式或 Docker 来运行 HBase。
- Hadoop 配置:HBase 通常与 Hadoop HDFS 集成,确保正确配置 Hadoop 和 HBase。
- 依赖:项目中需要添加 HBase 和 Hadoop 的依赖,下面是 Maven 项目中的依赖配置。
Maven 依赖
<dependencies>
<!-- HBase Client -->
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-client</artifactId>
<version>2.4.8</version>
</dependency>
<!-- Hadoop Common -->
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>3.2.2</version>
</dependency>
</dependencies>
HBase 示例代码
以下是一个简单的 HBase 使用案例,展示如何创建表、插入数据、获取数据和删除数据。
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;
import java.io.IOException;
public class HBaseExample {