为了解决数据为空而引起的show()报错,在过滤时使用 !x.isNullAt(1) 判断是否为空,为空就丢弃
//过滤 .getDouble(1) 1指第几个column,从0开始
DF.filter(x => !x.isNullAt(1) && x.getDouble(1) < 1995).show(10)
在数据分析中,当DataFrame存在空值时可能会导致`show()`方法报错。为解决此问题,可以使用Pandas或Spark DataFrame的`filter()`函数结合`isNullAt()`方法来过滤掉特定列为空的行。例如,通过`x.filter(!x.isNullAt(1) && x.getDouble(1) < 1995).show(10)`,我们可以确保显示的行在指定列中不为空且满足其他条件。这种方法对于确保数据质量并正确处理数据集非常关键。
//过滤 .getDouble(1) 1指第几个column,从0开始
DF.filter(x => !x.isNullAt(1) && x.getDouble(1) < 1995).show(10)
2396
392
1098
960

被折叠的 条评论
为什么被折叠?