HBase的ACID

最新推荐文章于 2024-01-21 03:36:18 发布

原创最新推荐文章于 2024-01-21 03:36:18 发布 · 445 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#大数据 #数据库

HBase 专栏收录该内容

1 篇文章

订阅专栏

HBase虽非严格ACID数据库，但提供了一定的ACID支持。文章介绍了HBase在原子性、一致性、隔离性、可见性及持久性方面的特点，包括读写APIs如何确保这些特性。例如，行级别的操作具有原子性，同一行的更新不会出现中间状态；scan操作能保证每一行的一致性状态；而可见性则确保一旦更新成功，立即对所有客户端可见；所有成功操作的数据都是持久化的。

HBase虽然不是严格意义上的ACID数据库，但其也在一定程度上对ACID做了适当的支持。本文将对HBase的ACID特性做一个简要的介绍。

首先对ACID做一个简单的定义，

A(Atomicity)原子性：一个事务中的一组操作要不全部完成，要不全部不完成，不可能只完成一部分。

C(Consistency)一致性：一个事务中所有的操作将保证数据表中的数据从一个有效状态转换到另一个有效状态，即从外部来看，数据是一致的。比如转账业务，从用户A中减去100块，存入用户B的账户中，在这个过程中，无论从用户A去查询还是从用户B去查询都可以确保这100块钱还存在于系统之中，不会出现程序将数据从A中减去了100块而没完成存入到B的过程，此时从A,B账户去查询都看不到这100块的情况。

I(Isolation)隔离性：同时执行事务中的操作相互之间不影响。

D(Durability）持久性：任何报告给client成功的操作都应该被永久保存在系统之中。

V(Visibility)可见性：任何更新操作都是可以被之后的读操作所见到的，就好像更新操作是被提交了一样。

以下从HBase的几方面来看HBase对于ACID的支持:

读APIs
- get
- scan
写 APIs
- put
- batch put
- delete
混合操作(read-modify-write) APIs
- incrementColumnValue
- checkAndPut

HBase在ACID的特性上所能保证的包括以下的一些特性：

原子性

所有对于一个hbase行的操作都是原子的，也即在hbase的table中加入，更新一行要不成功要不失败，不会部分成功部分失败，特别说明的是
1. 如果客户端(API)操作超时的话，改操作也是全部成功或全部失败，不会有部分成功的情况出现，这个是hbase在行上的原子操作的保证。
2. 操作跨多个CF（column family）也是一样，全部成功或全部失败
3. API对于跨行的操作是不能保证原子性的。比如说通过multiput去创造行'a','b','c'，可能从API的调用中得到对每一行各自的成功，失败了或超时状态。
4. 对于行的操作会按照一定的顺序进行，而不会出照操作之间的叠加而导致数据的异常。如一个线程对于一行的操作是"a=1,b=1,c=1",另一个线程对于该行的操作是"a=2,b=2,c=2",该行的最终值有可能是"a=1,b=1,c=1"或者"a=2,b=2,c=2";不可能出现"a=1,b=2,c=1"的情况，这个是hbase来保证的。但是要注意的是，跨多行的批量操作是不能保证这一点的。