
Hive
f369504543
这个作者很懒,什么都没留下…
展开
-
Hive-3-Hive架构
Hive架构 1、 用户接口 a) CLI (Command Line Interface) 命令行 在hive的bin目录下面执行./hive b) Client 客户端 启动命令为 nohup hive –service hiveserver & (nohup … &是Linux的命令,表示该命令在后台原创 2015-01-24 15:36:10 · 1490 阅读 · 0 评论 -
Hive-2-Hive的安装
1、 下载 查看支持你Hadoop版本的Hive版本,下载地址:http://archive.apache.org/dist/hive/ 解压:tar –zxvf hive-0.13.1.tar.gz 2、 编辑环境变量 vim /etc/profile 3、 修改配置文件 Hive的元数据存储支持Mysql和自带的Derby,我们设置为Mysql 编辑hive-s原创 2015-01-24 15:32:46 · 1040 阅读 · 0 评论 -
Hive-1-Hive介绍和工作原理
1、 什么是Hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 2、 Hive的工作流程图 3、 使用场原创 2015-01-24 15:08:30 · 2996 阅读 · 0 评论 -
Hive-4-Hive的文件格式
Hive文件格式 1、 TextFile 默认文件格式 数据不做压缩,磁盘开销大,数据解析开销大,可以结合Gzip、Bzip2使用(系统自动检测,执行查询时自动解压) 数据不会被Hive切分,所以无法对数据进行并行操作 创建命令: 2、 SequenceFile 是Hadoop API提供的一种二进制文件支持 使用方便、可分割、可压缩的特点 支持三种压缩方式原创 2015-01-24 15:40:23 · 1160 阅读 · 0 评论