大数据技术之Hive

Apache Hive 概述

        分布式SQL计算

        1.以分布式的形式,执行SQL语句,进行数据统计分析

        2.对数据进行统计分析,SQL是目前最为方便的编程工具。

        3.大数据体系中充斥着非常多的统计分析场景,使用SQL去处理数据,在大数据中是有极大的需求的

                ​​​​​​​        ​​​​​​​                

        4.不过MapReduce支持程序开发(Java、Python等),但不支持SQL直接进行开发,所以,我们要用到Apache Hive(一款分布式SQL计算的工具), 其主要功能是:将SQL语句 翻译成MapReduce程序运行。即:基于Hive为用户提供了分布式SQL计算的能力、写的是SQL、执行的是MapReduce。

        ​​​​​​​        ​​​​​​​        ​​​​​​​        

为什么使用Hive    

  • 使用Hadoop MapReduce直接处理数据所面临的问题 
  • 人员学习成本太高 需要掌握java、Python等编程语言
  • MapReduce实现复杂查询逻辑开发难度太大 

Apache Hive是做什么的

  • SQL语句翻译成MapReduce程序,从而提供用户分布式SQL计算的能力。

  • 传统

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值