1、过滤器:
1.1 按RowKey的前缀过滤
scan '212_BaseUnit_statisticdata',{FILTER=>"PrefixFilter('1806216')"}
1.2 前缀加版本号的过滤:
scan '213_BaseUnit_statisticdata',{FILTER=>"PrefixFilter('01103#1YS1812Z1010__213_Para7_Up')", VERSIONS=>100}
1.3 前缀、版本号、列过滤:
scan '213_BaseUnit_statisticdata',{FILTER=>"PrefixFilter('01103#1YS1812Z1010__213_Para7_Up')", VERSIONS=>100, COLUMNS=>['DATA:Max', 'DATA:Min']}
1.4 正则过滤器
import org.apache.hadoop.hbase.filter.RegexStringComparator
import org.apache.hadoop.hbase.filter.CompareFilter
import org.apache.hadoop.hbase.filter.SubstringComparator
import org.apache.hadoop.hbase.filter.RowFilter
scan 'ZJParamChange', {FILTER => RowFilter.new(CompareFilter::CompareOp.valueOf('EQUAL'),RegexStringComparator.new('^.*.1122.*.$'))}
2、建表
2.1、创建user表,包含info、data两个列族
create 'user', 'info1', 'data1'
或
create 'user', {NAME => 'info', VERSIONS => '3'}
3、插入数据
3.1、向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan
put 'user', 'rk0001', 'info:name', 'zhangsan'
4、查询
4.1、获取user表中row key为rk0001的所有信息
get 'user', 'rk0001'
4.2、获取user表中row key为rk0001,info列族的所有信息
get 'user', 'rk0001', 'info'
4.3、获取user表中row key为rk0001,info列族的name、age列标示符的信息
get 'user', 'rk0001', 'info:name', 'info:age'
4.4、获取user表中row key为rk0001,info、data列族的信息
get 'user', 'rk0001', 'info', 'data'
get 'user', 'rk0001', {COLUMN => ['info', 'data']}
get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']}
4.5、获取user表中row key为rk0001,列族为info,版本号最新5个的信息
get 'user', 'rk0001', {COLUMN => 'info', VERSIONS => 2}
get 'user', 'rk0001', {COLUMN => 'info:name', VERSIONS => 5}
get 'user', 'rk0001', {COLUMN => 'info:name', VERSIONS => 5, TIMERANGE => [1392368783980, 1392380169184]}
4.6、获取user表中row key为rk0001,cell的值为zhangsan的信息
get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
4.7、获取user表中row key为rk0001,列标示符中含有a的信息
get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}
5、scan
5.1、查询user表中列族为info的信息
scan 'user', {COLUMNS => 'info'}
scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5}
5.2、查询user表中列族为info和data的信息
scan 'user', {COLUMNS => ['info', 'data']}
scan 'user', {COLUMNS => ['info:name', 'data:pic']}
5.3、查询user表中列族为info和data且列标示符中含有a字符的信息
scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
5.4、查询user表中列族为info,rk范围是[rk0001, rk0003)的数据
scan 'people', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
5.5、查询user表中指定范围的数据
scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}
6、删除数据
6.1、删除user表row key为rk0001,列标示符为info:name的数据
delete 'people', 'rk0001', 'info:name'
6.2、删除user表row key为rk0001,列标示符为info:name,timestamp为1392383705316的数据
delete 'user', 'rk0001', 'info:name', 1392383705316
6.3、删除整行数据:
deleteall 'user', 'rk0001'
7、清空表
7.1、清空user表中的数据
truncate 'user'
8、修改表结构
8.1、添加两个列族f1和f2
alter 'people', NAME => 'f1'
alter 'user', NAME => 'f2'
8.2、删除一个列族:
alter 'user', NAME => 'f1', METHOD => 'delete' 或 alter 'user', 'delete' => 'f1'
8.3、添加列族f1同时删除列族f2
alter 'user', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'}
8.4、将user表的f1列族版本号改为5
alter 'people', NAME => 'info', VERSIONS => 5
9、禁用启用
9.1、禁用表
disable 'user'
9.2、启用表
enable 'user'
10、删除表
10.1、删除表(删除表之前需要先禁用表)
drop 'user'