Apache Spark DataFrame操作实战指南
1. 数据结构与基本操作
在处理结构化数据时,我们常常会用到DataFrame。首先,让我们来看一个示例,打印DataFrame的模式(schema):
// Print the schema
println(blogsDF.printSchema)
println(blogsDF.schema)
输出结果如下:
+---+---------+-------+-----------------+---------+-----+----------------------+
|Id |First |Last |Url |Published|Hits |Campaigns |
+---+---------+-------+-----------------+---------+-----+----------------------+
|1 |Jules |Damji |https://tinyurl.1|1/4/2016 |4535 |[twitter, LinkedIn] |
|2 |Brooke |Wenig |https://tinyurl.2|5/5/2018 |8908 |[twitter, LinkedIn] |
|3 |Denny |Lee |https://tinyurl.3|6/7/2019 |7659 |[web, twitter,...] |
|4 |Tathagata|Das |
超级会员免费看
订阅专栏 解锁全文
1435

被折叠的 条评论
为什么被折叠?



