【测试】FlinkSql映射kafka数据成表

最新推荐文章于 2025-04-27 19:59:27 发布

原创

最新推荐文章于 2025-04-27 19:59:27 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

本文档详细介绍了如何使用FlinkSql配置环境，处理kafka消息队列，解决配置过程中的错误，并通过FlinkSql将kafka数据建表，包括upsert表的操作。流程涵盖数据格式设计、kafka Topic管理、FlinkSql环境配置及错误解决，最终实现通过flinksql的upsert功能将数据转换为表。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

FlinkSql环境配置及测试文档

测试flinksql功能及1.12提供的 upsert，并尝试将目前的需求通过简单demo的方式实现

一、流程设计

1、确定数据格式

姓名,年龄,是否学生,操作类型,操作时间
name,age,isStu,opt,optDate

2、准备初始数据

zhangsan,18,1,insert
zhangsan,20,2,update
lisi,29,1,insert
wangwu,29,2,insert

3、新增数据，同时监测flink数据是否有变化

zhangsan,18,1,insert

二、kafka消息队列

1、创建topic

kafka-topics  --create --zookeeper 192.168.5.185:2181,192.168.5.165:2181,192.168.5.187:2181 --replication-factor 3 --partitions 3 --topic hz_test

2、模拟消费者

kafka-console-consumer  --bootstrap-server 192.168.5.185:9092,192.168.5.165:9092,192.168.5.187:9092 --topic test01 --from-beginning

3、模拟生产者

kafka-console-producer  --broker-list 192.168.5.185:9092,192.168.5.165:9092,192.168.5.187:9092 --to

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

槐序i

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
6
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

flink1.13 kafka connector 映射一张kafka表 demo

yy的博客

10-27

785

kafka创建topic并发送数据 /opt/kafka/bin/kafka-console-producer.sh --broker-list 192.168.9.99:9092 --topic topicName1 flink sql 建表关联kafka topic 进入sql-client sql-client.sh embedded 建表 drop table if exists tb1; CREATE TABLE tb1 ( name1 int ) WITH ( ...

使用Flink Kafka Connector将张表映射为Kafka主题的示例代码

TechChamp的博客

09-15

在本文中，我们将介绍如何使用Apache Flink和Kafka Connector将张表映射为Kafka主题。接下来，我们将创建一个Flink作业来将张表的数据发送到Kafka主题。我们将使用Flink的Table API和SQL API来处理数据和执行查询。使用您选择的构建工具（例如Maven或Gradle）构建和打包您的项目，并将生成的JAR文件提交给Flink集群来运行作业。这将在Flink集群上启动作业，并将张表的数据发送到指定的Kafka主题。替换为您希望将数据发送到的Kafka主题的名称。

6 条评论您还未登录，请先登录后发表或查看评论

FlinkSql从Kafka里面数据并且将数据转成表的Demo

张俊杰的博客

07-11

1253

Flink定义表结构使用FlinkSQL读取kafka里面数据不涉及到source和sink概念的. import org.apache.flink.streaming.api.scala._ import org.apache.flink.table.api.scala._ import org.apache.flink.table.api.{DataTypes, Table} import org.apache.flink.table.descriptors._ /** * 读取kafka的数据并

FlinkUpsertKafka深度解析

最新发布

qq_41067796的博客

04-27

867

特性通用 Kafka Connector主键要求必须定义 PRIMARY KEY无需主键数据变更支持支持 INSERT/UPDATE/DELETE仅支持 INSERT（Append-only）序列化配置需指定 Key 和 Value 格式仅需指定 Value 格式适用场景动态聚合、CDC 同步、幂等写入日志采集、一次性事件分区策略按主键分区按业务字段或随机分区典型错误未定义主键或格式不匹配导致报错无法处理更新操作通过上述对比可以看出，更适合需要处理数据变更的场景，而。

Flink tableapi从kafka创建表

qq_43118086的博客

10-18

679

从kafka创建表 oldTableEnv.connect(new Kafka() .version(“0.11”) .topic(“sensor”) .property(“zookeeper.connect”, “localhost:2181”) .property(“bootstrap.servers”, “localhost:9092”) ).withFormat(new Csv()) .withSchema(new Schema() .field(“id”, DataTypes.STRING())

【flink sql】kafka连接器

fuyun6363的博客

03-23

2991

R/W 列定义了一个元数据是可读的（R）还是可写的（W）。只读列必须声明为 VIRTUAL 以在 INSERT INTO 操作中排除它们。连接器可以读出消息格式的元数据。格式元数据的配置键以 ‘value.’ 作为前缀。Kafka 连接器提供从 Kafka topic 中消费和写入数据的能力。以下的连接器元数据可以在表定义中通过元数据列的形式获取。这篇博客聊聊怎么通过flink sql连接kafka。如果元数据名称和字段名称是一致的，可以省略。

flink sql 1.14 使用sql创建Kakfa动态表

weixin_45721882的博客

04-24

1191

需要的依赖 <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-kafka_2.12</artifactId> <version>${flink.version}</version> </dependency> <dependency> <groupId>o

【调研】FlinkSql功能测试及实战演练

遇事不决问春风

05-12

1440

FlinkSql功能测试及实战演练前言：Flink在国内的占有率逐步提升的情况下，各项组件的功能与稳定性也得到逐步提升。为了解决目前已有的复杂需求，尝试研究flinksql的特性与功能，作为是否引入该组件的依据。同时尝试将现有需求通过简单demo的形式进行测试。本次测试主要集中在Kafka、mysql、Impala三个组件上，同时将结合官方文档进行： https://ci.apache.org/projects/flink/flink-docs-release-1.12/zh/ 1 前期准备 1.1 环

Flink（十三）【Flink SQL（上）SqlClient、DDL、查询】

功不唐捐，玉汝于成

01-15

2103

Flink SQL sql-client、DDL语句、查询语句

Flink Sql教程（7）

狄杰的博客

06-03

4367

Redis异步维表概述之前和大家聊过维表，也聊过FLINK中如何使用维表，目前FLINK自带的维表有两种，一种是JDBC维表，一种是HBASE维表。其中JDBC维表支持缓存，HBASE暂不支持两种维表也都是同步维表，性能较弱我之前也说过会在后面的教程实现以下异步第三方维表，加上一个叫啤酒鸭的问我相关的问题，就抽空写了一把 redis异步客户端我用的是Lettuce，大家也可以用Redission，Jedis是同步的，大家千万注意不过和我之前说的一样，缓存会遇到旧数据的问题，所以也相当于给大家留了

flinkSql将嵌套Json映射成source表

jeseva的博客

08-28

2358

flinkSql在遇到复杂的json时,如何映射成表呢? 这里推荐一种方便的方式: 嵌套的json格式如下: { "data":{ "data":{ "mac_value":0, "ad_name":2056, "voice":75, "dataTimeStamp":1598522106830 }, "type":3, "deviceId":

Flink数据类型映射大全

karezi的博客

03-31

5756

Flink 支持连接多种数据库，如MySQL、PostgresSQL、Derby。Derby通常用于测试。从关系数据库数据类型到Flink SQL数据类型的字段数据类型映射如下表所示，映射表可以帮助在Flink中轻松定义JDBC表。

Flink系列之：Upsert Kafka SQL 连接器

zhengzaifeidelushang的博客

12-20

2945

更准确地说，数据记录中的 value 被解释为同一 key 的最后一个 value 的 UPDATE，如果有这个 key（如果不存在相应的 key，则该更新被视为 INSERT）。总之，这段代码的作用是通过Kafka连接器创建两个表，并将"pageviews"表中的数据计算出每个地区的pv和uv，并插入到"pageviews_per_region"表中。这段代码是用来创建两个表，一个是"pageviews_per_region"，另一个是"pageviews"，并定义了它们的结构和连接器。

2.1、如何在FlinkSQL中读取&写入到Kafka

热门推荐

向热爱自己一样，热爱这个世界。

10-11

1万+

使用 flinksql读取、写入kafka

Flink读取kafka主题，并写入hbase

taoyundao_1的博客

03-13

2582

是版本号错误 flink-sql-connector-hbase-2.2-1.17.2.jar 1.17.2与flink版本号不对。hbase(main):014:0> create 'venn','cf' 创建表，有一个列族cf。（4）对于一大题，可拆成若干步，如上面可拆成连接kafka，连接hbase，插入三步，缩小问题范围。本次解决问题是用了flink-sql-connector-hbase-2.2-1.17.2.jar。{"字段1": "值1", "字段2":"值2", ……

Apache Kafka系列(五) Kafka Connect及FileConnector示例

weixin_30644369的博客

08-29

509

Apache Kafka系列(一) 起步 Apache Kafka系列(二) 命令行工具（CLI） Apache Kafka系列(三) Java API使用 Apache Kafka系列(四) 多线程Consumer方案 Apache Kafka系列(五) Kafka Connect及FileConnector示例一. Kafka Connect简介　　Kafka是一个使用...

Flink 1.11 读取kafka注册为表

qq_31866793的博客

07-13

2158

先上代码： import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.table.api.EnvironmentSettings; import org.apache.flink.table.api.Table; import or.

Kafka——Kafka Connect详解

吴声子夜歌的博客

08-17

8324

Kafka Connect是一个高伸缩性、高可靠性的数据集成工具，用于在Apache Kafka与其他系统间进行数据搬运以及执行ETL操作，比如Kafka Connect能够将文件系统中某些文件的内容全部灌入Kafka topic中或者是把Kafka topic中的消息导出到外部的数据库系统，如图所示。如图所示，Kafka Connect主要由source connector和sink connector组成。

Flink SQL

qq_41081716的博客

11-05

600

以上步骤展示了如何使用 Flink SQL 从 Kafka 读取数据、进行聚合计算，并将结果分别写入 MySQL 和 HDFS。这是一个基本的流程，根据实际需求，可以调整表结构、连接器配置以及 SQL 查询以适应不同的应用场景。

flinksql映射kafka

01-08

### Flink SQL 中连接 Kafka 数据源与 Sink 的配置 #### 使用 DDL 定义 Kafka Source 和 Sink 表格为了在 Apache Flink 中使用 SQL 接口读取来自 Kafka 流的数据或将数据写回到 Kafka，可以采用 `CREATE TABLE` 语句来声明外部系统的表格。对于 Kafka 而言，这涉及到指定主题名称、键/值序列化方式以及其他必要的参数。 ```sql -- 创建一个名为 kafka_source 的表用于从 Kafka 获取数据 CREATE TABLE kafka_source ( change_machine_id INT, totalwarning INT, window_end_time STRING ) WITH ( 'connector' = 'kafka', 'topic' = 'input-topic', -- 输入的主题名 'properties.bootstrap.servers' = 'localhost:9092', -- Kafka broker 地址 'format' = 'json', -- 消息格式为 JSON 'scan.startup.mode' = 'earliest-offset' ); -- 创建一个名为 mysql_sink 的表作为目标位置保存处理后的结果 INSERT INTO mysql_sink SELECT * FROM kafka_source; ``` 上述命令展示了如何定义一个基于 Kafka 的输入流，并将其内容插入到另一个已存在的 MySQL 输出表中[^1]。 #### 构建自定义的 Kafka Sink 实现高可靠性传输除了简单的 SQL 插入外，在某些情况下可能还需要更复杂的逻辑控制，比如确保消息传递具有更高的可靠性和一致性级别。此时可以通过编程接口构建特定于应用需求的 Kafka Sink： ```java import org.apache.flink.connector.kafka.sink.KafkaSink; // 设置Kafka生产者属性 Properties props = new Properties(); props.setProperty("bootstrap.servers", "broker1:9092,broker2:9092"); // 构造Kafka Sink对象 KafkaSink<String> stringKafkaSink = KafkaSink.<String>builder() .setBootstrapServers("broker-list") .setRecordSerializer(KafkaRecordSerializationSchema.builder() .setTopic("output-topic") .setValueSerializationSchema(new SimpleStringSchema()) .build()) .setDeliverGuarantee(DeliveryGuarantee.AT_LEAST_ONCE) .build(); DataStream<String> stream = ... ; // 假设这里有一个字符串类型的DataStream stream.sinkTo(stringKafkaSink); ``` 这段 Java 代码片段说明了怎样创建一个带有至少一次投递保障机制 (`DeliveryGuarantee.AT_LEAST_ONCE`) 的 Kafka Sink 来发送记录给定的目标主题[^2]。 #### 利用 Flink SQL 处理并持久化至其他存储系统当需要进一步加工由 Kafka 收集的信息时，则可借助 Flink 提供的强大计算引擎来进行复杂查询运算；之后再把得到的结果存放到像 HDFS 或关系型数据库这样的长期储存介质里去。例如，如果想要高效解析 Kafka 数据并将它们以 Parquet 文件形式存储到分布式文件系统上，那么就可以按照如下方式进行设置[^3]: ```sql -- 将经过过滤和聚合的操作后产生的中间状态定期写出成 parquet 格式的文件 CREATE TABLE hdfs_parquet_table( ... ) PARTITIONED BY (...) WITH ( 'connector'='filesystem', 'path'='/user/flink/output/', 'format'='parquet' ); INSERT INTO hdfs_parquet_table SELECT ... ; ``` 以上就是关于如何在 Flink SQL 环境下配置 Kafka 数据源及 sink 的介绍，涵盖了基本概念及其实际应用场景下的实现细节。