Structured Streaming 实用指南:从执行原理到数据读写
1. 结构化流查询的执行原理
结构化流查询的执行循环适用于基于微批处理的触发模式(如 ProcessingTime 和 Once),但不适用于 Continuous 触发模式。以下是一个简单的代码示例:
# Python 示例
streamingQuery = counts.writeStream \
.format("console") \
.outputMode("complete") \
.trigger(processingTime="1 second") \
.option("checkpointLocation", checkpointDir) \
.start()
streamingQuery.awaitTermination()
// Scala 示例
import org.apache.spark.sql.functions._
import org.apache.spark.sql.streaming._
val spark = SparkSession...
val lines = spark
.readStream.format("socket")
.option("host", "localhost")
.option("port", 9999)
.load()
val words = lines.select(split(col("value"), "\\s").as("word"))
val counts
超级会员免费看
订阅专栏 解锁全文
787

被折叠的 条评论
为什么被折叠?



