1. 下载地址hive,这里我下载的版本是hive-0.12.0.
2. 我将hive的安装包上传到/usr/local/devtool/hive目录下面了,然后执行下面的命令。
3.进入到/usr/local/hive-0.12.0
4. 执行下面的命令。已经进入了hive的命令窗口。
5. 执行show databases;查看hive默认有哪些database.
6. 创建一个database 名为npf. create database npf.
7. 在npf 的database中创建表t_user.
我们发现在bin目录的统计目录下有一个新建的文件夹叫做metastore_db,我们的库和表的元数据就存在这里,同时hive也会在hdfs上面去写一些东西,例如下面:
其实我们刚才创建的t_user表并不是完整的,因为我们没有指定它与文件相关联。
所以我们现在把这个t_user表先drop掉,然后重新创建。
重新创建的table如下所示:
然后我们准备一份文件,例如user_data:
把我们的这份文件上传到hive在hdfs上面建立的那个文件夹里面去,例如:/user/hive/warehouse/npf.db/t_user
现在我们去hdfs上面去访问一下:
我们的数据已经进入到了这个文件里面,换句话说,也就是这个表里面已经有数据了。
现在用hive去操作下这个表,如下:
例如我们想查找年龄小于30岁的人:
现在我们想统计下这张表总共有多少数据。
本文详细介绍了如何下载并安装Hive 0.12.0版本,包括配置环境和基本操作步骤。通过实例演示了如何创建数据库及表,并关联文件数据,最后展示了如何查询与统计表中数据。
3864

被折叠的 条评论
为什么被折叠?



