问题笔记
今天在数据处理中遇到了几个小问题,在这里记录下,以便以后查询用:
1、逻辑回归模型应用中报错,
缺失值处理了,还出错,主要是inf值出现的错误。这主要出现在,变量用到了除法了。
2、pandas数据框去重,总是忘了函数怎么写的了,记录下:
DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)
详细参考:https://blog.youkuaiyun.com/MsSpark/article/details/83451491
data.isnull().any()