将 csv文件导入到hbase中
利用ImportTsv将CSV文件导入
首先将文件上传到hdfs上
hadoop fs -put /hbasePut.csv /Hbtest
在 hbase 中创建一张表,这张表即为 CSV 文件数据导入的表
然后退出 hbase shell ,输入下面命令调用 ImportTsv 将 csv 数据导入表中
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator="," -Dimporttsv.columns=HBASE_ROW_KEY,info:sno,info:sname,info:plt,info:alb,info:age40_60,info:ca,info:age_40,info:smo_his,info:le_woed,info:cap,info:age61_74,info:age74_,info:score hbase-csv1 /Hbtest/hbasePut.csv
一些解释
格式:hbase [类] [分隔符] [行键,列族] [表] [导入文件]
-Dimporttsv.columns=HBASE_ROW_KEY为行键
info为列族
后面则为列名
用hbase shell查询表的内容
scan 'hbase-csv1'
数据量较大,仅展示中间过程
统计表中数据行数
count 'hbase-csv1'
用phoenix在hbase上完成关系型数据库查询语句对表的查询
select * from "hbase-csv1"
结果较大,仅展示后面几行