电商数据降维与在线购买意向分析
1. 数据降维研究
在当今时代,数据量呈指数级增长,如何有效管理和利用这些数据成为关键问题。主成分分析(PCA)作为一种重要的数据降维技术,能够在减少数据量的同时,尽可能保留重要信息。
1.1 研究目标
- 分析应用PCA后结果矩阵的变化。
- 观察不同方差下主成分的数量。
- 比较降维数据集和原始数据集上系统的性能。
1.2 相关工作
此前已有众多关于消费者行为分析和机器学习算法的研究。例如,有研究使用人工神经网络(ANN)和随机森林(RF)分析影响消费者行为的因素;也有研究从技术和信任角度分析在线购物者的购买意向。同时,PCA在多个领域都有广泛应用,如分析化石牙齿数据、研究海平面压力数据以及降低数字图像维度等。
1.3 研究方法
-
样本收集与数据集 :数据集来自Facebook上的消费者行为分析研究,共有656条数据,包含22个属性。在预处理阶段,部分属性被减少。为了平衡数据集,采用了Python中imbalanced - learning包的合成少数过采样技术(SMOTE)。
|问题|数量|百分比|
| ---- | ---- | ---- |
|年龄:11 - 30|634|96.6%|
|年龄:31 - 60|19|2.5%|
|年龄:61 - 90|2|0.3%|
|年龄:≥90|1|0.15%|
|性别:男|534|81.5%|
|性别:女|11
超级会员免费看
订阅专栏 解锁全文
749

被折叠的 条评论
为什么被折叠?



