1、distinct去重时会考虑所有列
2、dropDuplicates去重时,可以选择某几列,针对这些列去重。
spark中dropDuplicates和distinct的区别
最新推荐文章于 2025-05-07 14:30:23 发布
本文介绍了两种数据去重方法:distinct 和 dropDuplicates。distinct 方法会在所有列上进行去重操作;而 dropDuplicates 方法则允许选择特定的列进行去重。这两种方法在数据处理中非常实用。

864

被折叠的 条评论
为什么被折叠?



