目录 摘 要 1.问题的重述 1.1 问题背景 1.2 问题提出 2.基本假设与符号说明 2.1 基本假设 2.2 符号说明 3.任务一的分析与求解 3.1 问题分析 3.2 数据拼接 3.3 缺失值处理 3.4 LabelEncoder 类别编码 3.5 异常值处理 4.任务二的分析与求解 4.1 问题分析 4.2 城市用户分布情况分析——基于热力图和玫瑰饼状图 4.3 用户登录情况分析 4.3.1 用户登录天数分析 4.3.2 用户登录间隔分析 4.3.3 用户登录距离期末天数分析 4.3.4 用户登录时长分析 5.任务三的分析与求解 5.1 问题分析 5.2 LightGBM 模型 5.2.1 GBDT 算法 5.2.2 LightGBM 算法 5.3 模型求解 5.4 求解结果 5.5 结果分析 6.任务四的分析与求解 6.1 问题分析 6.2 分析结果及建议 6.3 小结 7.总结与展望 7.1 总结 7.2 展望 参考文献 代码实现 任务一和任务二: 任务三: 任务四 摘 要 互联网的快速发展给各领域公司提供了获客渠道。为实现判别高质量的用户、优化 公司的营销成本,实现小成本促销,达到提高用户转化率的目标。本文拟解决以下任务。 针对任务一,本文首先将所给的 4 张用户表根据用户信息表中‘ user_id ’拼接得到 一张完整的用户详情表。其次,针对数据中