FlinkSql读取外部Mysql和HBase数据库的方法(scala)

inori1256

于 2024-11-04 18:05:23 发布

阅读量723

点赞数 22

文章标签： mysql hbase flink

本文链接：https://blog.youkuaiyun.com/inori1256/article/details/143489679

版权

我的Flink版本为1.13.6

<flink.version>1.13.6</flink.version>

FlinkSql读取外部的MySQL是走的JDBC所以需要以下两个依赖：

        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-connector-jdbc_${scala.binary.version}</artifactId>
            <version>1.13.6</version>
        </dependency>
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.25</version>
        </dependency>

读取HBase需要如下依赖：

        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-connecto

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

inori1256

关注关注

22
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Flink1.2.1通过Table API / Flink SQL读取HBase2.4.0

Ashiamd的博客

02-11

703

Flink读取Kafka数据Sink到MySQL和HBase数据库

qq_27552579的博客

01-20

651

Flink读取Kafka数据Sink到MySQL和HBase数据库 Flink将流数据Sink到数据库，一般需要自己自定义Sink的实现。下面示例，演示Sink到MySQL和HBase示例。在这里插入代码片 import java.util.Properties import org.apache.flink.api.common.serialization.SimpleStringSchema ...

参与评论您还未登录，请先登录后发表或查看评论

Flink SQL查询HBase维表

修破立生

01-26

3710

本文讲解了通过Flink SQL查询Hbase维度数据的方法和示例

Flink-SQL 读取hbase 问题总结

dymkkj的专栏

04-26

1094

flink-sql 将kafka 流表写入hbase。– flink-sql 读取hbase列簇(数据列)– 定义在flink hbase流表。

Flink SQL 实战：HBase 的结合应用

Ververica的博客

12-01

1422

本文主要介绍 HBase 和 Flink SQL 的结合使用。HBase 作为 Google 发表 Big Table 论文的开源实现版本，是一种分布式列式存储的数据库，构建在 HDFS...

【在Flink开发中，读取外部数据源MySQL数据的方法（scala编写）】

最新发布

2203_75584759的博客

10-28

1522

flink-Datastream_api中怎么把mysql作为source获取数据

spark读取hbase数据，并使用spark sql保存到mysql

09-24

本示例将详细介绍如何使用 Spark 从 HBase 中读取数据，并通过 Spark SQL 将其存储到 MySQL 数据库中。首先，让我们了解 Spark 与 HBase 的交互。Spark 提供了 `spark-hbase-connector` 库，允许我们方便地连接到 ...

以前自己写的一套，从kafka获取数据源，通过flink插入my-flink_kafka_mysql-hbase.zip

01-31

标题中的“从kafka获取数据源，通过flink插入my-flink_kafka_mysql-hbase”表明这个项目涉及了大数据处理的三个关键组件：Kafka、Flink和HBase。Kafka是一个分布式流处理平台，Flink是实时计算框架，而HBase是一个...

flink 异步io mysql 缓存_Flink 异步IO访问外部数据（hbase、mysql篇）

weixin_42390041的博客

02-01

537

接上篇：【翻译】Flink 异步I / O访问外部数据最近看了大佬的博客，突然想起Async I/O方式是Blink 推给社区的一大重要功能，可以使用异步的方式获取外部数据，想着自己实现以下，项目上用的时候，可以不用现去找了。最开始想用scala 实现一个读取 hbase数据的demo，参照官网demo：/*** An implementation of the ‘AsyncFunction‘ t...

FlinkSQL实战：HBase的结合应用

02-23

HBase作为Google发表BigTable论文的开源实现版本，是一种分布式列式存储的数据库，构建在HDFS之上的NoSQL数据库，非常适合大规模实时查询，因此HBase在实时计算领域使用非常广泛。可以实时写HBase，也可以利用buckload一把把离线Job生成HFileLoad到HBase表中。而当下FlinkSQL的火热程度不用多说，FlinkSQL也为HBase提供了connector，因此HBase与FlinkSQL的结合非常有必要实践实践。当然，本文假设用户有一定的HBase知识基础，不会详细去介绍HBase的架构和原理，本文着重介绍HBase和Flink在实际场景中的结合使用

flink sql连接hbase

张不帅

11-02

1410

文章目录创建hbase表可以设置参数 public static final ConfigOption<String> TABLE_NAME = ConfigOptions.key("table-name").stringType().noDefaultValue().withDescription("The name of HBase table to connect."); public static final ConfigOption<String> ZOO

flink SQL与hbase整合

m0_37592814的博客

12-02

5531

一、前言 flink sql 与hbase 整合主要实现：flink sql 客户端中的hbase表与hbase中的表数据交互，为以后纯sql编写程序做准备如：创建kafka表、hive表、hbase表、mysql表，kafka表作为source hive表 sql语句加工作为算子 hbase表、mysql表作为sink表 1.flink sql 客户端中能读取hbase shell 写入的数据 2.flink sql 客户端写入hbase表中的数据在hbase shell中能读取 flink ..

Hbase建表FLinksql 任务运行

weixin_44236758的博客

07-01

397

【代码】Hbase建表FLinksql 任务运行。

Flink连接Hbase

lck_csdn的博客

05-10

2507

这里写自定义目录标题1.添加依赖2.Hbase连接工具类3.执行读取Hbase数据4.错误日志，及解决方式4.1AccessDeniedException4.2NoSuchColumnFamilyException 1.添加依赖 <properties> <flink.version>1.13.6</flink.version> <java.version>1.8</java.version> &lt

FlinkSQL连接JDBC

fengfengzai0101的博客

09-17

2019

运行FlinkSQL ./sql-client.sh embedded --jar /home/<username>/flink-connector-jdbc_2.11-1.11.0.jar --jar /home/<username>/mysql-connector-java-8.0.21.jar 创建表 CREATE TABLE test ( a string, b int, c string, PRIMARY KEY (a) NOT ENFORCED ) WI

FlinkSQL 读写 MySQL

L, there!

10-22

7725

package com.sm.job import com.sm.utils.FlinkUtils import org.apache.flink.streaming.api.scala._ import org.apache.flink.table.api.bridge.scala.StreamTableEnvironment import org.apache.log4j.Level import org.slf4j.LoggerFactory /** * flinkSQL 读写 mysql .

Flink 内容分享(七)：Flink 读写 HBase 总结

之乎者也·的博客

12-30

4194

总结 Flink 读写 HBase本文总结了Flink SQL 读写 HBase 的参数配置，解决了在kerberos环境下因 hudi 包 hbase-site.xml 配置冲突引起的异常，学习总结了 Flink SQL 读写 HBase 时加载 HBase 配置的优先级，但是没有详细的分析源码中的逻辑，可能会在后面的文章中补充相关的源码分析~

Flink-JDBC-Connector求助

qq_67358234的博客

05-22

309

flink-jdbc-connector

【Flink实时数仓】需求一：用户属性维表处理-Flink CDC 连接 MySQL 至 Hbase 实验及报错分析

qq_31412425的博客

07-21

713

这个代码是sql-client.sh中成功读取到MySQL插入的数据，此时在MySQL中对数据的操作即可通过FlinkCDC连接展示在此界面。下面这个黑窗口界面是Hbase的查看界面，首先在idea中启动上述的测试代码。通过清空和查看表名，也可以看到flink cdc的连接效果。使用Flink CDC连接MySQL，在Hbase中实时同步数据库的修改。这个只是其中一个报错，还有一些报错没有截图，是以依赖问题居多。这一步遇到过几个坑，依赖的冲突和依赖版本。这是在小松鼠界面输入的命令。

flinksql hbase 维表

08-02

FlinkSQL中如何关联Hbase大表，如果关联字段不是Hbase维表的rowkey，将会触发全表扫描。FlinkSQL的Hbase connector不会处理索引，所以我们可以采用自己维护索引表的方式来解决这个问题。具体实现方式可以参考Hbase二级索引的知识。[1] 在FlinkSQL中，我们可以通过Flink HBase SQL Connector从HBase读取维度数据，进行数据补全。首先需要引入相关依赖，如下所示： ```xml <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-hbase-2.2_${scala.binary.version}</artifactId> <version>${flink.version}</version> </dependency> ``` 然后可以注册Kafka表和Hbase表，示例如下： ```sql CREATE TABLE fact( key STRING, value1 STRING, proctime AS PROCTIME() ) WITH ( 'connector' = 'kafka', 'topic' = 'test-hb', 'properties.bootstrap.servers' = 'localhost:9092', 'properties.group.id' = 'testGroup', 'scan.startup.mode' = 'latest-offset', 'format' = 'json' ); CREATE TABLE hb_stream( rowkey String, cf ROW<age String, name String>, PRIMARY KEY (rowkey) NOT ENFORCED ) WITH ( 'connector' = 'hbase-2.2', 'table-name' = 'test', 'zookeeper.quorum' = 'localhost:12181' ); ``` 通过以上配置，我们可以在FlinkSQL中使用Hbase维表进行关联操作。[2] 在实时数据开发中，通常会使用Spark或Flink消费Kafka数据流，并与外部数据库（如Hbase、MySQL等）进行维表关联。如果外部数据库中既包含维度数据，又包含大量的事实数据，并且这些数据更新频繁且数据量巨大，我们需要选择一个适合的外部数据库来支持实时场景的需求。Hbase是一个可以满足海量数据高效读写性能的外部数据库，因此在这种情况下可以选择使用Hbase作为支持。[3]