八天学会hadoop (5) hadoop 高可用 hive 入门

Hadoop高可用与Hive入门详解

最新推荐文章于 2022-05-12 01:22:53 发布

原创

最新推荐文章于 2022-05-12 01:22:53 发布 · 507 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了Hadoop实现高可用的机制，包括active和standby NameNode的设置，以及依赖Zookeeper的qjournal在高可用中的作用。接着，深入讲解了Hive的工作流程，包括CREATE语句如何创建元数据，以及查询语句如何被编译成Java jar包并执行。文章还提到了Hive只能执行查询，不能执行添加操作，并详细阐述了Hive导入数据、managed table和external table的区别，以及分区的本质。最后，讨论了Hive支持的数据类型，如数组和map，并说明了在shell环境下执行Hive语句的情况。

Hadoop 高可用

想要高可用必须有两个namenode 一个active 一个standby namenode中的edits文件由第三方qjournal(依赖zookeeper)保存。

hive 流程

首先是create语句会创建一些元信息存到元数据库比如表名创建时间

下次执行查询语句先经过hive的compiler模块生成java jar包然后经过runner模块提交jar包运行程序。

hive 只能执行查询操作不能进行进行添加操作

hive 导入本地数据到hive表里面实际上数据是传到/user/hive/warehouse/数据库/表里面

hive 里面表分为managed table 和external 表 managed的表数据统一在./user/hive/warehouse 如果drop掉的话元数据信息和数据都会删除。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。