
Spark
Dream__people
不必仰望别人,因自己也是一道风景。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark之RDD
一 、 RDD概述 1.1 什么事RDD? RDD(Resilient Distributed Dataset) 叫做弹性分布式数据集,他代表一个不可变、可分区、里面的元素可以并行计算的集合。RDD具有数据流模型的特变:自动容错、位置感知性调度和可伸缩性。RDD允许用户执行多个查询时显示的将工作集缓存在内存中,后续的查询能够重用工作集,这极大地提升了查询速度。 1.2 RDD的属性...原创 2020-04-12 15:43:02 · 274 阅读 · 0 评论 -
大数据技术Spark_WordCount学习 (第一篇)
Spark WordCount开发 创建的是maven工程,使用的依赖如下: <dependency> <groupId>org.scala-lang</groupId> <artifactId>scala-library</artifactId> <version>2.10.5</vers...原创 2019-12-06 19:34:24 · 173 阅读 · 0 评论