075 importSTV的使用，与bulkload的使用

最新推荐文章于 2025-08-13 20:07:08 发布

转载最新推荐文章于 2025-08-13 20:07:08 发布 · 101 阅读

文章标签：

#大数据

本文介绍了三种将数据导入HBase的方法：直接从HDFS导入、转换为HFile后再导入及使用自定义分隔符导入。提供了详细的命令示例，帮助读者理解和实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一:由HDFS将数据直接导入到HBase中

1.生成TSV文件

2.内容

3.上传到HDFS

4.运行

　　export HBASE_HOME=/etc/opt/modules/hbase-0.98.6-hadoop2
　　export HADOOP_CLASSPATH=`$HBASE_HOME/bin/hbase mapredcp`
　　export HADOOP_HOME=/etc/opt/modules/hadoop-2.5.0

　　$HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,info:age,info:name,info:sex nstest1:tb1 /imp/import.tsv

　　重要的是：

　　　　）HBASE_ROW_KEY

　　　　）info：name，等都要和import.tsv相对应

　　　　）表名是将要书写进去的表名

5.结果

二：将数据转换为HFile

1.将数据转为HFile

　　hbase-0.98.6-hadoop2]$ $HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar importtsv -Dimporttsv.bulk.output=/impout -Dimporttsv.columns=HBASE_ROW_KEY,info:age,info:name,info:sex nstest1:tb2 /imp/import.tsv　　

　　其中：nstest1：tb2的作用是按照这个表的格式进行转换HFile

　　/impout 是HFile的路径。