[HBase基础]-- spark创建hbase表(非分区表)

最新推荐文章于 2025-05-18 17:31:24 发布

oo寻梦in记

最新推荐文章于 2025-05-18 17:31:24 发布

阅读量3.9k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/high2011/article/details/52495048

Apache Spark 同时被 3 个专栏收录

137 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

Scala

72 篇文章

订阅专栏

HBase

30 篇文章

订阅专栏

本文详细介绍了如何使用Spark在本地或集群环境下创建HBase非分区表，并进行数据插入。首先，配置了所需的环境，包括IDEA、Scala、CDH Spark、JDK和HBase版本。接着，创建Maven工程，导入Spark相关JAR包，并在pom.xml中添加依赖。在Scala代码中编写创建表和插入数据的逻辑。最后，提供了在集群上运行的步骤，包括Kerberos认证的处理方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、spark本地或者集群创建hbase表(不需要Kerberos认证)、并且插入数据

1、环境准备：idea 16+scala-2.10.4+cdh-spark-1.6.1+jdk-1.7+hbase-1.2.0-cdh5.8.0

2、 (1)创建maven工程:pdf-hbase

(2)新建一个文件夹libs，导入cdh的spark jar，添加jar到项目中

spark-assembly-1.6.0-cdh5.8.0-hadoop2.6.0-cdh5.8.0.jar

spark-examples-1.6.0-cdh5.8.0-hadoop2.6.0-cdh5.8.0.jar

(3)编写pom.xml文件，导入相关的依赖包

3、编写实现的spark代码

ScalaHbaseCreate.scala类如下：

package controller.spark
import org.apache.hadoop.hbase.client.{Get, HBaseAdmin, HTable, Put}
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.hadoop.hbase.util.Bytes
import org.apache.hadoop.hbase.{HBaseConfigura

了解本专栏