目录 摘 要 一、 问题重述 1 . 1 问题背景 1 . 2 提出问题 二、 数据预处理 2 . 1 数据整理与清洗 2 . 1 . 1 数据拼接 2 . 1 . 2 去除唯一属性 2 . 1 . 3 处理重复值和缺失值 2 . 2 数据降维 2 . 2 . 1 数据标准化 2 . 2 . 2 使用主成分分析法降维 2 . 3 数据预处理总结 三、 数据分析与可视化 3 . 1 用户地市分布情况 3 . 2 用户登录情况 四、 判别模型的构建与评价 4 . 1 线性判别模型的思路 4 . 2 线性判别模型的求解 五、 给贵企业的一些建议 参考文献 代码实现 数据链接的 Python 源程序 主成分分析的 R 源程序 线性判别的 R 源程序 摘 要 本文以主成分分析、线性判别分析等方法为理论基础,针对某 K12 教育企业的用户 消费行为进行了价值分析。基于企业提供的 13 万条用户数据包含 49 个指标,我们先进 行了对数据的整理、清洗和降维处理,之后将处理好的数据进行多类别的可视化分析, 并