Hive映射结构化数据经验小结

深海少女心

于 2019-05-23 16:56:41 发布

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏： linux 理论概念 hive 大数据文章标签：大数据总结 linux hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42418158/article/details/90483733

大数据同时被 3 个专栏收录

21 篇文章

订阅专栏

17 篇文章

订阅专栏

11 篇文章

订阅专栏

博客主要总结了使用Hive处理结构化数据的方法。通过创建Hive表与已有结构化数据文件建立映射关系，映射成功后可用SQL进行数据分析，避免编写MR。同时指出数据库、表与对应文件夹的映射关系，以及结构化数据存放位置和建表时指定分隔符的要点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.对结构化数据的处理，都是通过操作hive中的映射表完成，比如查询数据的个数：

select  count(*) from t_1;

在这里插入图片描述
总结：hive创建一张表，跟已经存在的结构化数据文件产生映射关系，
映射成功之后，就可以通过sql来对结构化数据进行分析，避免写mr的麻烦。数据库和/user/hive/warehouse/xx文件夹映射，表和/user/hive/warehouse/xx文件夹/数据映射，结构化数据要放到映射的目录下面，建表的时候可能需要指定分隔符，否则映射不成功。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。