
Spark
文章平均质量分 75
Spark系列
源图客
这个作者很懒,什么都没留下…
展开
-
Apache Spark 3.5介绍与部署(最新版本)
Apache Spark 是一个快速的,通用的集群计算系统。它对 Java,Scala,Python 和 R 提供了的高层 API,并有一个经优化的支持通用执行图计算的引擎。它还支持一组丰富的高级工具,包括用于 SQL 和结构化数据处理的 Spark SQL,用于机器学习的 MLlib,用于图计算的 GraphX 和 Spark Streaming。Apache Spark是一个开源的分布式计算框架,最早由加州大学伯克利分校AMPLab团队在2012年发布。原创 2025-01-24 12:01:30 · 1146 阅读 · 0 评论 -
Apache Celeborn详解与部署应用
Apache Celeborn 源于自研的 EMR Remote Shuffle Service,旨在解决中间数据遇到的及问题。原创 2024-10-26 12:06:36 · 1733 阅读 · 0 评论 -
Apache Livy介绍与部署
Apache Livy 是一个为 Apache Spark 提供的强大而灵活的 RESTful 接口,旨在让开发者无论在何处,都能轻松地与 Spark 进行交互。这个开源项目支持执行代码片段或程序,并且可以在本地 Spark 环境或 Apache Hadoop YARN 集群中运行。应用场景总的来说,Apache Livy 是一个强大、开放且易于使用的工具,对于那些希望在 Spark 上构建更高效、更灵活的数据处理系统的开发者而言,它是一个理想的选择。原创 2024-10-16 11:14:01 · 1461 阅读 · 0 评论 -
Spark调优汇总
spark调优原创 2024-08-19 21:23:05 · 828 阅读 · 0 评论 -
SparkSQL
在sql方法中,我们可以直接运行sql语句,persons可以理解为一张表,那么表中的数据 需要从数据源中导入,所以spark sql提供了两种方式的载体来从数据源中加载数据,一个是:DataFrame,另一个是DataSet。DataFrame中提供了详细的数据结构信息,从而使得SparkSQL可以清楚地知道该数据集中包含哪些列,每列的名称和类型各是什么,DataFrame中的数据结构信息,即为schema。DataFrame除了提供了比RDD更丰富的算子以外,更重要的特点是提升执行效率。原创 2024-08-16 20:58:31 · 1067 阅读 · 0 评论 -
SparkStreaming概述与编程
SparkStreaming概述与编程原创 2024-08-12 10:39:49 · 1225 阅读 · 0 评论 -
RDD执行算子
Spark RDD执行算子原创 2024-08-08 15:32:22 · 549 阅读 · 0 评论 -
RDD转换算子(五)-分组算子及源码解析
Spark分组算子原创 2024-08-08 14:38:50 · 722 阅读 · 0 评论 -
RDD转换算子(四)-缓存算子及源码解析
Spark缓存算子原创 2024-08-08 14:11:06 · 820 阅读 · 0 评论 -
RDD转换算子(三)-分区算子及源码解析
分区算子原创 2024-08-07 23:23:13 · 920 阅读 · 0 评论 -
RDD转换算子(二)-KV算子(键值类)及源码解析
Spark键值类转换算子原创 2024-08-07 23:04:42 · 1126 阅读 · 0 评论 -
RDD转换算子(一)-Value算子(单值类)
Spark转换算子Value原创 2024-08-07 22:11:09 · 830 阅读 · 0 评论 -
Spark创建RDD的几种方式
spark创建rdd的几种方式原创 2024-08-07 16:37:36 · 681 阅读 · 0 评论 -
第一个Spark程序
第一个Spark工程原创 2024-08-07 16:15:41 · 749 阅读 · 0 评论 -
Linux环境下spark-3.5.1(最新版本)部署
Spark集群部署原创 2024-08-04 22:39:03 · 714 阅读 · 0 评论 -
Linux环境下scala2.12.18部署
scala2.12安装原创 2024-08-04 22:30:05 · 324 阅读 · 0 评论 -
GeoSpark实现热点分析案例
热点分析原创 2024-08-03 15:03:05 · 154 阅读 · 0 评论 -
GeoSpark应用中封装GShape对象
【代码】GeoSpark应用中封装GShape对象。原创 2024-08-02 10:20:15 · 116 阅读 · 0 评论 -
GeoSpark实现图形Union操作
【代码】GeoSpark实现图形Union操作。原创 2024-08-02 10:15:55 · 155 阅读 · 0 评论 -
Linux环境下Spark2.4.3集群部署
Spark集群安装部署原创 2024-07-20 10:21:52 · 395 阅读 · 0 评论