
Hive
f369504543
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive-3-Hive架构
Hive架构1、 用户接口 a) CLI (Command Line Interface) 命令行在hive的bin目录下面执行./hiveb) Client 客户端启动命令为 nohup hive –service hiveserver & (nohup … &是Linux的命令,表示该命令在后台原创 2015-01-24 15:36:10 · 1506 阅读 · 0 评论 -
Hive-2-Hive的安装
1、 下载查看支持你Hadoop版本的Hive版本,下载地址:http://archive.apache.org/dist/hive/解压:tar –zxvf hive-0.13.1.tar.gz2、 编辑环境变量vim /etc/profile3、 修改配置文件Hive的元数据存储支持Mysql和自带的Derby,我们设置为Mysql编辑hive-s原创 2015-01-24 15:32:46 · 1057 阅读 · 0 评论 -
Hive-1-Hive介绍和工作原理
1、 什么是Hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。2、 Hive的工作流程图 3、 使用场原创 2015-01-24 15:08:30 · 3036 阅读 · 0 评论 -
Hive-4-Hive的文件格式
Hive文件格式1、 TextFile 默认文件格式数据不做压缩,磁盘开销大,数据解析开销大,可以结合Gzip、Bzip2使用(系统自动检测,执行查询时自动解压)数据不会被Hive切分,所以无法对数据进行并行操作创建命令: 2、 SequenceFile 是Hadoop API提供的一种二进制文件支持使用方便、可分割、可压缩的特点支持三种压缩方式原创 2015-01-24 15:40:23 · 1179 阅读 · 0 评论