
Hive
muyingmiao
这个作者很懒,什么都没留下…
展开
-
Spark对接Hive:整合Hive操作及函数
1.拷贝hive-site.xml文件到spark的conf目录下2.[hadoop@hadoop002 bin]$ ./spark-shell --master local[2] --jars ~/software/mysql-connector-java-5.1.47.jar 注意用5版本的mysql-connector-javascala> spark.sql("sh...原创 2020-03-12 22:48:08 · 946 阅读 · 0 评论 -
Hive在使用MySQL5.7的数据库会提示:WARN: Establishing SSL connection without server's identity verification ...
Hive在使用过程中,会提示hive (default)> show databases;Mon Oct 28 19:26:54 CST 2019 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.4...原创 2019-10-28 22:05:25 · 546 阅读 · 1 评论 -
hive首次启动后,MySQL中没有元数据[Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHive...]
Hive启动后,执行show databases会报错hive (default)> show databases;FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache....原创 2019-10-28 19:30:51 · 466 阅读 · 0 评论 -
Hive的动态分区以及动态分区引入的问题
动态分区与静态分区区别就是动态分区是通过位置来对应分区值的,插入数据的时候不用显示的指定分区字段,即不指定分区目录,由系统自己选择。以emp表的数据为例:hive (test)> create table emp_dynamic_partition( > empno int, > ename string, ...原创 2019-10-16 15:37:55 · 350 阅读 · 0 评论 -
Hive读取复杂的数据类型(Array,Map,Struct)
1.数组数据文件 hive_array.txt,Array(1,2,3,4) 装的数据类型是一样的zhnagsan PEK,SHA,HAK,NKGlisi CTU,CKG,XIY,CSX创建表:create table hive_array(name string, work_locations array<string>)row forma...原创 2019-10-16 15:04:35 · 14176 阅读 · 2 评论 -
Hive读取URL
工作中,有时候在使用Hive时候会去解析URL,获取一些参数:hive (default)> select parse_url_tuple("http://www.ruozedata.com/d7/xxx.html?cookieid=1234567&a=b&c=d", > "HOST", > "PATH...原创 2019-10-16 12:03:53 · 1157 阅读 · 0 评论 -
Hive读取json数据源
1.数据格式如下图2.创建表并加载数据hive (test)> create table rating_json(json string);hive (test)> load data local inpath '/home/hadoop/testdata/json/rating.json' into table rating_json;Loading data to tab...原创 2019-10-16 11:56:03 · 705 阅读 · 0 评论 -
通过Hive实现wc(词频统计)
Hive的词频统计主要用到了Hive的split函数和explode函数hive (test)> desc function extended split;OKtab_namesplit(str, regex) - Splits str around occurances that match regexExample: > SELECT split('oneAtwo...原创 2019-10-16 10:10:59 · 768 阅读 · 0 评论 -
hive通过修改源码永久注册UDF
1.先下载对应版本的源码,地址:http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.15.1-src.tar.gz2.找出对应的java文件,并对其修改[hadoop@hadoop000 hive-1.1.0-cdh5.7.0]# find . -name FunctionRegistry.java./ql/src/java/or...原创 2019-10-07 23:55:25 · 256 阅读 · 1 评论 -
Hive 自定义UDF函数
在使用hive中,有时要根据业务需求自定义一些函数,下面是自定义函数的步骤1.新建一个maven项目,在项目的pom文件中引入依赖 <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</a...原创 2019-09-25 17:49:52 · 599 阅读 · 0 评论