HBASE的CRUD操作

最新推荐文章于 2023-12-23 11:25:49 发布

萧萧落木知秋

最新推荐文章于 2023-12-23 11:25:49 发布

阅读量1.5k

点赞数

CC 4.0 BY-SA版权

分类专栏： hbase 文章标签： hbase

本文链接：https://blog.youkuaiyun.com/heiye123456/article/details/79060611

hbase 专栏收录该内容

1 篇文章

订阅专栏

HBASE中最基本的操作是CRUD（Creat,Read,Update,Delete）操作，HBase提供了两种方式实现相关操作，即JAVA API和HBASE shell。

Put 类

Put类是Hbase存储数据的基本类，通过api可知，put的构造方法有多种，但无论哪种构造方法，都需要传入行键row，如：

Put(byte[] row)
Put(byte[] row,RowLock rowlock)
Put(byte[] row,long ts)
Put(byte[] row,long ts,RowLock rowlock)
Put类的add方法可以添加columnfamily，qulifier,value信息其方法为：

add(byte[] family,byte[] qualifier,longtimestamp,byte[] value)

add(byte[] family,byte[] qualifier,longtimestamp,byte[] value)

每调用一次add()方法，将增加一列数据。如果用户在增加数据时没有指定时间戳，将使用region服务器的系统时间作为时间戳。

我们注意到在put类中的属性，大量使用byte数组，hbase提供了各种类来将java数据类型转为byte[]数组；Bytes.toBytes(int a); Bytes.toBytes(String str) ; Bytes.toBytes(ButyBuffer bb);

此外，put类还提供了一系列其他方法，来检查或获取相应的单元格信息，如：

getRow() 返回put实例的行键

getTimeStampu()	返回put实例的时间戳
heapSize()	获取put实例占用的堆内存
isEmpty()	检查familyMap中是否包含keyValue实例
……

向hbase插入数据的代码实例：

import java.io.IOException;
 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.Admin;
import org.apache.hadoop.hbase.client.Connection;
import org.apache.hadoop.hbase.client.ConnectionFactory;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Table;
import org.apache.hadoop.hbase.util.Bytes;
 
public class hbaseCRUD {
   public staticvoid main(String[]args) throws IOException {
      Configuration conf = HBaseConfiguration.create();
      Connection conn = ConnectionFactory.createConnection(conf);
      Admin admin =conn.getAdmin();
      if (admin ==null) {
         System.out.println("admin is null,please check it");
         System.exit(0);
      }
      String tablestr ="data1_2018_01_01";
      TableName tableName = TableName.valueOf(tablestr.getBytes());
      Table table=conn.getTable(tableName);
      Put put =new Put(Bytes.toBytes("row1"));
      put.addColumn(Bytes.toBytes("colfm1"), Bytes.toBytes("qualifier1"), 123456789, Bytes.toBytes("val1"));
      put.addColumn(Bytes.toBytes("colfm2"), Bytes.toBytes("qualifier2"), 123456789, Bytes.toBytes("val2"));
      table.put(put);
      table.close();
   }
 
}

HTableDescriptor

HBase中表结构由HTableDescriptor描述(包括HColumnDescriptor),对表的新增\修改\删除操作在接口HMasterInterface中定义,而该接口由HMaster实现

(1)HTableDescriptor包含：

表名,byte[]和String格式;

表的元信息,以key-value形式存储,包括文件较大的大小(默认256M)、是否只读、flush时内存占用大小(默认64M)、是否root或meta region、DEFERRED_LOG_FLUSH;

表的各Family描述HColumnDescriptor;

(2)HColumnDescriptor：描述column family的信息，包括：

压缩格式(不压缩,仅压缩value,压缩block中的一系列记录);

数据的版本数量;

block的大小(???);

是否在内存中;

是否cache block;