Spark介绍
PySpark 是Apache Spark的Python接口。它不但允许你用Python API写Spark应用,而且也提供了Pyaprk Shell在分布式环境中交互式分析你的数据.PySpark支持大多数Spark功能如Spark SQL,DataFrame,Streaming,Mlib(机器学习)和Spark Core.Spark SQL 和 DataFrameSpark SQL是Spark结构化数据处理模块.它提供了抽象编程的DataFrame和能充当分布式SQL查询引擎。Spark 上的
翻译
2021-11-05 18:59:00 ·
343 阅读 ·
0 评论