hive 底层是mapreduce,因此也很慢,但是它可以通过sql语句做方便操作在离线处理方面可以做数据分析。
hbase是NOsql,查询非常快,近实时查询,解决了hdfs不能修改的缺陷。
spark适用于实时查询,hbase速度稍慢于spark,也可用作实时查询,但是hbase可对数据做增删改;hive底层实现是hadoop的mapreduce,因此不使用与实时查询,hive是数据仓库,提供hql语句加大了使用人群,但是不能对数据做修改。
本文对比了Hive、HBase与Spark的特点及适用场景。Hive基于MapReduce,适合离线数据分析但不支持实时查询;HBase作为NoSQL数据库,实现了近实时查询并弥补了HDFS不可更新的不足;Spark则更适用于实时数据处理。
hive 底层是mapreduce,因此也很慢,但是它可以通过sql语句做方便操作在离线处理方面可以做数据分析。
hbase是NOsql,查询非常快,近实时查询,解决了hdfs不能修改的缺陷。
spark适用于实时查询,hbase速度稍慢于spark,也可用作实时查询,但是hbase可对数据做增删改;hive底层实现是hadoop的mapreduce,因此不使用与实时查询,hive是数据仓库,提供hql语句加大了使用人群,但是不能对数据做修改。
8717

被折叠的 条评论
为什么被折叠?