Spark SQL DML语句

原创

已于 2024-12-28 15:50:31 修改 · 1.2k 阅读

·

32

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#spark #sql #大数据

于 2024-12-25 16:31:54 首次发布

【图书介绍】《Spark SQL大数据分析快速上手》-优快云博客

《Spark SQL大数据分析快速上手》【摘要书评试读】- 京东图书

Spark本地模式安装_spark3.2.2本地模式安装-优快云博客

DML（Data Manipulation Language，数据操作语言）操作主要用来对数据进行插入、更新和删除操作。本节主要介绍Spark SQL中的DML操作。

Spark SQL提供了一个命令行工具，可以让用户直接通过命令行运行SQL查询。Spark SQL可以兼容Hive，以便Spark SQL支持Hive表访问、UDF（用户自定义函数）以及Hive查询语言（HiveQL/HQL）。

若要使用Spark SQL CLI的方式访问和操作Hive表数据，需要对Spark SQL进行如下所示的环境配置，将Spark SQL连接到一个部署好的Hive上。

（1）将hive-site.xml复制到/home/hadoop/app/spark/conf/目录下。

（2）在/home/hadoop/app/spark/conf/spark-env.sh文件中配置MySQL驱动。

将MySQL驱动复制到所有节点的Spark安装包的jars目录下，并在/home/hadoop/app/spark/ conf/spark-env.sh末尾添加以下内容：

export SPARK_CLASSPATH=/home/hadoop/app/spark/jars/mysl-connector-java-5.1.32.jar

然后，启动MySQL服务。

（3）启动 Hive的metastore服务：hive–service metastore &。

（4）进入/home/hadoop/app/spark/sbin/目录，执行./start-all.sh，启动Spark。

（5）进入/home/hadoop/app/spark/bin目录，执行./spark-sql，开启Spark SQL CLI。

spark-sql本质上是通过spark-submit调用Spark SQL的API，每个spark-sql单独启动一个应用。

一旦进入Spark SQL

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。