Spark-Sql整合hive，在spark-sql命令和spark-shell命令下执行sql命令和整合调用hive

最新推荐文章于 2025-05-13 14:45:00 发布

我能火起来吗

最新推荐文章于 2025-05-13 14:45:00 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/qq_44884269/article/details/89384942

本文介绍了如何在 Spark SQL 中整合 Hive，包括将 Hive 相关配置文件放入 Spark 配置目录、修改日志级别、启动 Spark Shell 指定 MySQL 连接驱动、创建及加载 Hive 表的操作步骤。同时提供了在 spark-sql 和 spark-shell 命令下执行 HQL 的示例。

首先给大家分享一个巨牛巨牛的人工智能教程，是我无意中发现的。教程不仅零基础，通俗易懂，而且非常风趣幽默，还时不时有内涵段子，像看小说一样，哈哈～我正在学习中，觉得太牛了，所以分享给大家！点这里可以跳转到教程

1.安装hive
如果想创建一个数据库用户，并且为数据库赋值权限，可以参考：http://blog.youkuaiyun.com/tototuzuoquan/article/details/52785504

2.将配置好的hive-site.xml、core-site.xml、hdfs-site.xml放入$SPARK_HOME/conf目录下

[root@hadoop1 conf]# cd /home/tuzq/software/hive/apache-hive-1.2.1-bin[root@hadoop1 conf]# cp hive-site.xml $SPARK_HOME/conf[root@hadoop1 spark-1.6.2-bin-hadoop2.6]# cd $HADOOP_HOME[root@hadoop1 hadoop]# cp core-site.xml $SPARK_HOME/conf[root@hadoop1 hadoop]# cp hdfs-site.xml $SPARK_HOME/conf同步spark集群中的conf中的配置[root@hadoop1 conf]# scp -r * root@hadoop2:$PWD[root@hadoop1 conf]# scp -r * root@hadoop3:$PWD[root@hadoop1 conf]# scp -r * root@hadoop4:$PWD[root@hadoop1 conf]# scp -r * root@hadoop5:$PWD
  
  
  
   
   1
   
   2
   
   3
   
   4
   
   5
   
   6
   
   7
   
   8
   
   9
   
   10
   
   11

放入进去之后，注意重新启动Spark集群，关于集群启动和停止，可以参考：

http://blog.csdn.net/tototuzuoquan/article/details/74481570
  
  
  
   
   1

修改spark的log4j打印输出的日志错误级别为Error。修改内容为：
这里写图片描述

3.启动spark-shell时指定mysql连接驱动位置

bin/spark-shell --master spark://hadoop1:7077,hadoop2:7077 --executor-memory 1g --total-executor-cores 2 --driver-class-path /home/tuzq/software/spark-1.6.2-bin-hadoop2.6/lib/mysql-connector-java-5.1.38

最低0.47元/天解锁文章

新学期VIP享超值加赠