
数据挖掘
James_dw
本人为人诚实,待人诚恳,性格随和,善于与人沟通和团队协作;有强烈求知欲和进取心,具有较强的自学能力。
展开
-
Spark是什么,如何使用Spark(之一)
阅读本文章可以带着下面问题:1.Spark基于什么算法的分布式计算(很简单)2.Spark与MapReduce不同在什么地方3.Spark为什么比Hadoop灵活4.Spark局限是什么5.什么情况下适合使用Spark原创 2014-10-15 21:32:05 · 2060 阅读 · 0 评论 -
Spark核心是什么,如何使用Spark(之二)
本篇文章很重要,也是spark为什么是Spark原因:1.Spark的核心是什么?2.RDD在内存不足时,是怎么处理的?3.如何创建RDD,有几种方式4.Spark编程支持几种语言5.是否能够写出一个Driver程序Spark核心概念Resilient Distributed Dataset (RDD)弹性分布数据集RDD是Spark的最基本抽象,是对分布式内存原创 2014-10-15 21:35:51 · 1186 阅读 · 0 评论