
spark
文章平均质量分 75
james二次元
分享大数据及AI相关技术,每天进步一点点,和大家一起学习、一起进步!
展开
-
Spark的部署模式
Apache Spark 提供了多种方式来提交任务,每种方式都有其特定的用途和优缺点。以下是对几种常见任务提交模式的详细介绍:根据具体的应用场景和需求,选择合适的任务提交模式可以充分发挥 Spark 的性能和优势。原创 2024-07-20 07:45:00 · 421 阅读 · 0 评论 -
数据仓库之SparkSQL
Apache Spark SQL是Spark中的一个组件,专门用于结构化数据处理。它提供了通过SQL和DataFrame API来执行结构化数据查询的功能。原创 2024-06-21 08:30:00 · 1075 阅读 · 0 评论 -
大数据平台之Spark
Apache Spark 是一个开源的分布式计算系统,主要用于大规模数据处理和分析。它由UC Berkeley AMPLab开发,并由Apache Software Foundation维护。Spark旨在提供比Hadoop MapReduce更快的处理速度和更丰富的功能,特别是在处理迭代算法和交互式数据分析方面。原创 2024-06-20 09:00:00 · 1414 阅读 · 0 评论 -
spark2+kafka报错:java.lang.NoSuchMethodError:org.apache.kafka.clients.consumer.KafkaConsumer.subscribe
spark读取kafka数据 // Create DataFrame representing the stream of input lines from kafka val lines = spark.readStream .format("kafka") .option("kafka.bootstrap.servers", "kafka1:9092,kafka2:9092,kafka3:9092") .option("subscribe", ".原创 2021-02-01 11:47:54 · 2252 阅读 · 1 评论