1.1 读入数据
df = spark.read.csv('building.csv', header=True, inferSchema=True)
1.2 展示数据
# show the content of the dataframe
df.show()

1.3 展示数据类型
df.printSchema()

1.4 dataframe创建rdd型数据库
dfrdd = df.rdd
dfrdd.take(3) #展示前三组,看看是什么样

2.1 select
df.select('BuildingID', 'Country').show()
<