Spark自有生态圈(以Spark为核心)

● 1.3.0 及后续版本中,SchemaRDD 已经改名为DataFrame,DataFrame的概念来自于R语言
● 1.4才有Spark R,他是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Spark
● 1.6引入Dataset接口
更大的生态圈

如何对待
● 无需纠结谁替代谁(相互补充)
● 以某一个组件为突破口逐渐深入
● 大局观和生态意识
● 一切以应用场景为出发点
从1.3.0版本开始,Spark引入了DataFrame概念,源于R语言的灵感;1.4版发布SparkR,实现了R语言与Spark的轻量级集成;1.6版则加入了Dataset接口,展示了Spark生态圈的持续创新与扩展。

● 1.3.0 及后续版本中,SchemaRDD 已经改名为DataFrame,DataFrame的概念来自于R语言
● 1.4才有Spark R,他是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Spark
● 1.6引入Dataset接口

● 无需纠结谁替代谁(相互补充)
● 以某一个组件为突破口逐渐深入
● 大局观和生态意识
● 一切以应用场景为出发点

被折叠的 条评论
为什么被折叠?