Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。 DataFrame().columns from pyspark.sql import Row df = sc.parallelize([ Row(name='Alice', age=5, height