spark structured streamming 写出数据到kafka

最新推荐文章于 2024-07-20 07:15:00 发布

iFence

最新推荐文章于 2024-07-20 07:15:00 发布

阅读量325

点赞数 1

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Vector97/article/details/105134113

版权

Spark 专栏收录该内容

9 篇文章

订阅专栏

前言

导包等一些基础的准备问题就不说了，有问题留言。

微信公众号：大数据报文

Main

虽然说的是streamming，但是这里会分别说流处理和批处理。

流处理

val ds = df
//注意这里的as("value")是必须的，因为写入kafka的数据一定要有value，根据实际情况也需要指定key
  .selectExpr(formats($"USERID", $"ADDRESS", $"XQMC").as("value"),lit("data_increment_data.kafka.kafIns.water.t_water.*.*.*").as("key"))
  .writeStream
  .format("kafka")
//注意这里的参数kafka.bootstrap.servers，而不是bootstrap.servers，写成这样会提示没有bootstrap.servers参数
  .option("kafka.bootstrap.servers", "host1:port1,host2:port2")
  .option("topic", "topic1")
  .start()

批处理

//注意事项与流处理一样，只是这里不需要指定outputmode，action由start变成了save()
waterDF.select(formats($"USERID", $"ADDRESS", $"XQMC").as("value"),lit("data_increment_data.kafka.kafIns.water.t_water.*.*.*").as("key"))
                .write
                .format("kafka")
                .option("kafka.bootstrap.servers", "master:9098")
                .option("topic", "water")
                .save()

sink结果

可以看到指定了key和value都写入到指定位置了。

错误处理

由于上述，把option("kafka.bootstrap.servers", "master:9098")，错写成option("bootstrap.servers", "master:9098")，导致报错

Caused by: org.apache.kafka.common.config.ConfigException: Missing required configuration "bootstrap.servers" which has no default value。

如果不注意，看到这个问题很奇怪，因为我明明指定了bootstrap.servers了啊，但是其实是指定错了。

总结

有些有头无尾，只写了数据如何sink到kafka并没有说如何接入kafka的数据。下次有机会补上。有问题也可以留言。

博客等级

码龄7年

111
原创

148
点赞

396
收藏

7764
粉丝

关注

私信

分类专栏

Flink 26篇
docker 1篇
SpringCloud 1篇
Springboot 18篇
mongo 1篇
golang 1篇
clickhouse 1篇
Shell 1篇
Redis 3篇
ES 6篇
React 5篇
Typora 2篇
brew 1篇
Git 1篇
js 2篇
pyecharts 1篇
ML 1篇
Spark 9篇
Java 24篇
Maven 4篇
思考
Kafka 8篇
Kerberos 2篇
IDE 2篇
Scala 6篇
Python 8篇
pandas 4篇
DataFrame 1篇
Hadoop 4篇
Linux 2篇

最新评论

【kafka-ui】支持kafka with kraft的可视化集群管理工具
iFence: 问题很明确了，未知主机异常。是不是kafka集群的ip配置错了
Kerberos认证的kafka常见错误记录
不是海克萨斯是吉野啊喂38: 抓到个一小时前的，我也好想知道
Kerberos认证的kafka常见错误记录
xx在冲: 请问是怎么配置kerberos 信息的呢？可以把代码贴出来吗
Kerberos认证的kafka常见错误记录
xx在冲: 请问是怎么配置kerberos 信息的呢？可以把代码贴出来吗
【kafka-ui】支持kafka with kraft的可视化集群管理工具
谭书c: 为啥Kraft模式，用这个还是报错： Error connecting to node xxx:9092 (id: 2 rack: null) java.net.UnknownHostException: xxx: Try again

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。