什么是hive 基于hadoop的数据仓库工具(本身不存储数据) 本质是:将HQL转换为MR程序 优点 使用sql实现避免使用mr,减少开发人员学习成本执行延迟比较高,适用于数据分析,对实时性要求不高处理大数据任务好,不利于处理小数据支持用户自定义函数 缺点 HQL表达能力有限 (1)迭代式计算无法表达 (2)数据挖掘方面不擅长效率比较低 (1)自动生成mr作业,不够智能化 (2)hive调优比较困难 架构