- 博客(4)
- 收藏
- 关注
原创 使用隔离森林算法查找异常值
可以看到,有18个国家/地区被标识为离群值(这些国家的离群值为-1)。contamination(混合)参数同样被设置为0.1。bootstrap=构建Tree时,下次是否替换采样,为True为替换,为False为不替换。4)创建离群值(outlier)和内围值(inlier)的DataFrame.隔离森林找到离群值的方法是,对数据进行连续区分,直至某个数据点被隔离。按人均GDP、年龄中位数和每百万人口病例数划分离群值和内围值的国家。3)运行隔离森林模型以检测离群值。5)绘制离群值和内围值。
2024-08-22 16:02:57
414
原创 APP用户行为分析
两种用户类型,用户账号名称计数5992,去重后有5944,两种注册渠道,209个子站,用户唯一ID5622个,注册地区有三个。# 游戏APP用户行为数据分析。数据清洗,查看空值和重复项。
2024-08-05 16:31:33
633
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人