Spark(31) -- Dataset (DataFrame) 的基础操作补充
最新推荐文章于 2025-02-17 18:32:55 发布
本文主要介绍了Spark Dataset(DataFrame)中的Column对象及其常见操作,包括有类型转换和无类型转换。此外,详细阐述了DataFrame中缺失值的处理,包括何时会出现无效值、如何处理null和NaN,以及DataFrameNaFunctions提供的drop、fill和replace方法。最后讨论了如何使用SparkSQL处理null和异常字符串。






订阅专栏 解锁全文
1071

被折叠的 条评论
为什么被折叠?



