
Hive
Peasmaster
这个作者很懒,什么都没留下…
展开
-
hive-1.1.0-cdh5.7.0 编译安装
环境说明:1、虚拟机为VM102、Linux系统为centos6.53、Hadoop为hadoop-2.6.0-cdh5.7.04、JDK为jdk-8u45-linux-x64.gz5、Maven为apache-maven-3.3.9-bin.zip6、MySQL为MySQL-Linux-5.6【以上环境必须提前装备好】7、hive-1.1.0-cdh5.7.0Hive原创 2018-02-07 11:33:28 · 1187 阅读 · 1 评论 -
Hive 常用建表及语法
创建数据库CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_name=property_value, ...)];--案例 create database ...原创 2018-05-15 10:08:04 · 577 阅读 · 0 评论 -
Hive 压缩
压缩优点省空间网络传输快降低IO压缩缺点CPU负载增加如果不支持分割,并行度低常用压缩名称code压缩压缩时间解压时间是否支持分割Snappyorg.apache.hadoop.io.compress.SnappyCodec49.96%6.4119.84否gziporg.apache.hadoop.io.compress.Gzi...原创 2018-11-20 11:11:44 · 279 阅读 · 0 评论 -
Hive中map-join 和 reduce-join
配置hive.auto.convert.join0.11版本之后默认是true。hive.mapjoin.smalltable.filesize/hive.smalltable.filesizemap join通常用于一个很小的表和一个大表进行join的场景,具体小表有多小,由参数 hive.mapjoin.smalltable.filesize来决定,该参数表示小表的总大小,默认值为2...原创 2018-11-28 16:49:30 · 1256 阅读 · 0 评论 -
Hive中beeline连接报错 Required field 'client_protocol' is unset! Struct:TOpenSessionReq
报错信息如下:Required field ‘client_protocol’ is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=defalut})排查:版本号不对,输入beeline后发现版本号中有spark字样[root@hadoop001 lib]# beelineBe...原创 2019-04-27 00:20:57 · 3829 阅读 · 2 评论 -
windows中IDEA使用Spark2.2.0连接hive1.1.0报错: java.lang.RuntimeException: java.lang.NullPointerException;
报错信息如下:java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.java.lang.IllegalArgumentException: Error while instantiating ‘org.apache.spark.sql.hive.HiveSes...原创 2019-04-28 22:22:49 · 3203 阅读 · 3 评论