Hive映射结构化数据经验小结

博客主要总结了使用Hive处理结构化数据的方法。通过创建Hive表与已有结构化数据文件建立映射关系,映射成功后可用SQL进行数据分析,避免编写MR。同时指出数据库、表与对应文件夹的映射关系,以及结构化数据存放位置和建表时指定分隔符的要点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.对结构化数据的处理,都是通过操作hive中的映射表完成,比如查询数据的个数:
select  count(*) from t_1;

在这里插入图片描述
总结:hive创建一张表,跟已经存在的结构化数据文件产生映射关系,
映射成功之后,就可以通过sql来对结构化数据进行分析,避免写mr的麻烦。数据库和/user/hive/warehouse/xx文件夹映射,表和/user/hive/warehouse/xx文件夹/数据映射,结构化数据要放到映射的目录下面,建表的时候可能需要指定分隔符,否则映射不成功。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值