SparkSQL On Hive和spark的内存分配问题

最新推荐文章于 2024-06-06 10:32:00 发布

weixin_30737363

最新推荐文章于 2024-06-06 10:32:00 发布

阅读量264

点赞数

CC 4.0 BY-SA版权

文章标签：大数据数据库

原文链接：http://www.cnblogs.com/lyr999736/p/10229653.html

本文详细介绍如何在Spark环境中集成Hive，包括配置hive-site.xml，启动Hadoop和SparkSQL服务，以及通过Beeline连接Hive进行数据操作。同时，解决Spark版本升级导致的jar包路径变更问题，深入解析Spark内存分配机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Spark On Hive

1.SparkSQL集成Hive，需将hive-site.xml复制到{SAPRK_HOME/conf}目录下，即可！！
　　a.将hive-site.xml复制到{SAPRK_HOME/conf}目录下；
　　b.将hive-site.xml复制到所有Spark节点；
　　c.将MySQL驱动包[mysql-connector-java-5.1.36-bin.jar]复制到{SPARK_HOME/jars}；
　　d.开启Hadoop；
　　　　$>zKServer.sh start
　　　　$>start-dfs.sh
　　　　$>strat-yarn.sh
　　e.开启sparkSQL
　　　　$>spark-sql //默认开启“Local模式”
　　　　　　等价于：spark-sql --master local
　　f.如果在Standalone模式下：
　　　　$>spark-sql --master spark://master:7077
　　　如果在Spark on yarn模式下：
　　　　$>spark-sql --master yarn
　　g.在spark-sql命令行中，编写HQL
　　　　spark-sql>show databases;
　　　　spark-sql>use hive;
　　　　spark-sql>select * from student;

thriftServer Beeline 连接 Hive

1.将hive-site.xml复制到{SAPRK_HOME/conf}目录下；
　　
　　　　<property>
　　　　　　<name>hive.server2.thrift.bind.host</name>
　　　　　　<value>master</value>
　　　　</property>
　　
　　　　<property>
　　　　　　<name>hive.server2.thrift.client.user</name>
　　　　　　<value>Alex_lei</value>
　　　　</property>
　　　　<property>
　　　　　　<name>hive.server2.thrift.client.password</name>
　　　　　　<value>123456</value>
　　　　</property>
2.开启hive的ThriftServer服务
　　$>hiveserver2
3.在{SPARK_HOME/bin}目录下，执行beeline
　　$>beeline
　　Beeline version 1.2.1.spark2 by Apache Hive
　　beeline>
4.在{beeline>}光标处，添加!connect,如下：
　　beeline>!connect jdbc:hive2://master:10000/default
5.添加用户名：
　　beeline> !connect jdbc:hive2://master:10000/default
　　Connecting to jdbc:hive2://master:10000/default
　　Enter username for jdbc:hive2://master:10000/default:Alex_lei
6.添加密码：
　　beeline> !connect jdbc:hive2://master:10000/default
　　Connecting to jdbc:hive2://master:10000/default
　　Enter username for jdbc:hive2://master:10000/default: Alex_lei
　　Enter password for jdbc:hive2://master:10000/default: ******
7.成功连接！
　　beeline> !connect jdbc:hive2://master:10000/default
　　Connecting to jdbc:hive2://master:10000/default
　　Enter username for jdbc:hive2://master:10000/default: Alex_lei
　　Enter password for jdbc:hive2://master:10000/default: ******
　　18/09/07 12:51:11 INFO jdbc.Utils: Supplied authorities: master:10000
　　18/09/07 12:51:11 INFO jdbc.Utils: Resolved authority: master:10000
　　18/09/07 12:51:11 INFO jdbc.HiveConnection: Will try to open client transport with JDBC Uri: jdbc:hive2://master:10000/default
　　Connected to: Apache Hive (version 1.2.1)
　　Driver: Hive JDBC (version 1.2.1.spark2)
　　Transaction isolation: TRANSACTION_REPEATABLE_READ
　　0: jdbc:hive2://master:10000/default>
　　0: jdbc:hive2://master:10000/default>
　　0: jdbc:hive2://master:10000/default>
　　0: jdbc:hive2://master:10000/default> show databases；
8.退出
　　0: jdbc:hive2://master:10000/default> !quit
　　Closing: 0: jdbc:hive2://master:10000/default