hive
Hive是一个构建于Hadoop顶层的数据仓库工具,支持大规模数据存储、分析,具有良好的可扩展性。某种程度上可以看作是用户编程接口,本身不存储和处理数据。依赖分布式文件系统HDFS存储数据,依赖分布式并行计算模型MapReduce处理数据。
定义了简单的类似SQL 的查询语言——HiveQL,用户可以通过编写的HiveQL语句运行MapReduce任务,可以很容易把原来构建在关系数据库上的数据仓库应用程序移植到Hadoop平台上。(是一个可以提供有效、合理、直观组织和使用数据的分析工具)
(1)Hive与传统数据库的区别
对比项目 |
Hive |
传统数据库 |
数据插入 |
支持批量导入 |
支持单条 |