hive
小强的进阶之路
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive
数据管理 hive的表本质就是hadoop的目录/文件,hive默认表存放路径一般都是在你的工作目录里面,按照表名做文件夹分开,如果有分区表的话,分区值是子文件夹,可以直接在其他的M/R job里直接应用这部分数据 hive支持4个数据模型: 数据表 Table External Table 分区表 Partition 分桶表 Bucket ...原创 2018-05-20 13:51:51 · 326 阅读 · 0 评论 -
hive、impala、prestoDB 优缺点对比
hive 优点 缺点 被广泛应用,经受时间的考验 既然是基于Mapreduce,也拥有MapReduce所有缺点,包含昂贵的Shuffle操作和磁盘IO操作 运行在Mapreduce框架之上 hive仍然不支持多个reduce操作group by和order by查询 非常好的支持用户自定义函数 和其他竞品相比,查询速度很慢 很友好的和hbase等系统结合 ...原创 2018-11-26 16:29:07 · 4922 阅读 · 1 评论
分享