全部都是文字,简单说一下自己的理解,hive和hbase都是基于hadoop的,但细节不同,对于开发来说,hive提供了类似sql的操作,支持jdbc,你写了sql以后他可以自己帮你转换为MapReduce程序去执行,这一点就很好,而hbase不行,使用他需要再去学习对应的查询,更新语句,比较麻烦.hive可以用来统计查询,hbase可以用来实时统计处理.hive速度要慢很多,hbase要快一些,做实时处理比hive更适合.
下面是具体的区别.
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。
两者的特点
Hive帮助熟悉SQL的人运行MapReduce任务。因为它是JDBC兼容的,同时,它也能够和现存的SQL工具整合在一起。运行Hive查询会花费很长时间,因为它会默认遍历表中所有的数据。虽然有这样的缺点,一次遍历的数据量可以通过Hive的分区机制来控制。分区允许在数据集上运行过滤查询,这些数据集存储在不同的文件夹内,