一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据。
由运行时引擎翻译成MapReduce作业
本文介绍Hive作为分布式数据仓库的特点,它通过按列存储优化数据读取效率,并使用SQL查询语言简化大数据处理流程。Hive将SQL转换为MapReduce任务,实现高效的大数据批处理。
一个分布式、按列存储的数据仓库。Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据。
由运行时引擎翻译成MapReduce作业
1万+
3683
4067

被折叠的 条评论
为什么被折叠?