HIVE数据导出是比较简单的,直接用HIVE自带的命令即可:
从HIVE中导出表数据到本地文件中hive -e "select * from prs.prs_goods_b2b" > prs_goods_b2b
但是导出来的数据是用HIVE自带的分隔符。查了下貌似HIVE没有导出数据指定分割符的语句。看起来只能在linux里处理了

刚刚打开还以为是空格作为分隔符,所以直接用sed -i 's/ /,/g‘ prs_goods_b2b处理了下,结果发现没用,看起来不是空格。于是用hexdump 看了下

可以看出分隔符应该是09。再用09试试

一切OK了
Hive数据导出实战
本文介绍了如何使用Hive命令将数据导出到本地文件,并解决了导出数据默认分隔符的问题。通过查看十六进制内容确定了分隔符为09,并提供了具体的替换方法。
2903

被折叠的 条评论
为什么被折叠?



