今天在hue上执行数据的重新导入:
1、删除原先的kudu表:drop table events_tab_2;
2、需要在impala里创建kudu新表:
CREATE TABLE events_tab_2( user_id STRING , item_id STRING , create_time BIGINT , col_1 STRING , col_12 STRING , col_13 STRING , col_14 STRING , col_15 STRING , col_16 STRING , col_17 BIGINT , col_18 BIGINT , col_19 STRING , col_20 DOUBLE , col_21 BIGINT , col_22 BIGINT , col_23 BIGINT , col_24 STRING , col_25 STRING , col_26 STRING , col_28 BIGINT , col_32 STRING , PRIMARY KEY (user_id, item_id, create_time) ) PARTITION BY HASH (user_id) PARTITIONS 16 STORED AS KUDU;
3、将数据导入。
在执行第2步的时候,遇到了坑和错误:

在使用Hue执行数据重新导入到Kudu表时遇到问题,尝试删除并重建Kudu表`events_tab_2`时收到错误提示表已存在。尽管在Impala和HDFS中未找到该表,但发现Kudu独立存储了其自己的'区域'。解决方案是在Linux命令行中使用`impala::smg_user_2.events_tab_2`来操作。
最低0.47元/天 解锁文章
1万+





