
Spark
文章平均质量分 91
还是那个同伟伟
百万代码中取bug首级
展开
-
Pyspark DataFrame常用操作函数和示例
1.打印前几行1.1 show()函数show()函数会将指定数量的行(默认是 20 行)转换为字符串并打印到控制台。无返回值,直接打印数据到控制台。df.show() # 默认显示前 20 行df.show(10) # 显示前 10 行1.2 take()函数用于获取 DataFrame 的前 N 行数据,返回一个包含 Row 对象的列表。返回一个包含 Row 对象的列表。返回一个包含前 N 行数据的列表,每行数据以 Ro原创 2024-09-06 16:35:30 · 1463 阅读 · 0 评论 -
Spark与PySpark(1.概述、框架、模块)
大规模数据处理的统一分析引擎弹性分布式数据集(即RDD)的概念。原创 2023-12-11 16:44:38 · 1747 阅读 · 0 评论