基于sqoop将hive数据导入到Oracle中
根据项目的需要,数据要从hive的app层导出到oracle进行数据结果的加工及展示在相应的系统上。
数据导入流程:
hive的分区表数据–>oracle的实体表中
数据表oracle创建:(字段与hive保持一致)
sqoop中导入可能存在的问题,hive表的存储格式为textfile时,使用export-dir参数时导入的数据会有脏数据的情况,记得要手动处理掉!!
sqoop版本1.4.4Z之后建议选择hcatalog参数进行导入
普通导入:
sqoop export \
--connect jdbc:oracle:thin:@//ip:端口号/实例
--username 用户
--password 密码
--table 表名(Oracle表名:表名大写)
--columns 列名
--export-dir HDFS数据存储路径
--input-fields-terminated-by