电商数据维度分析及在线购买意向研究
1. 电商数据维度分析
1.1 研究背景与目标
随着数据量的爆炸式增长,大量数据呈现出非结构化的特点。为了有效利用这些数据,科学家和数据分析师采用了各种创新技术,其中降维技术在数据科学领域应用广泛。在F - 电商(Facebook电商)领域,数据量也在不断增加。本研究旨在通过主成分分析(PCA)对F - 电商数据集进行降维,并评估人工神经网络(ANN)和随机森林(RF)模型在不同方差下的性能。具体目标如下:
- 分析应用PCA后结果矩阵的变化。
- 观察不同方差下主成分的数量。
- 比较降维数据集和原始数据集的系统性能。
1.2 相关工作
在消费者行为分析方面,已有众多研究。Hossain等人使用ANN和RF分析了影响F - 电商消费者购买行为的因素;Heijden等人从技术和信任的角度研究了在线购物者的购买意向;Kumar发现消费者对在线市场的行为取决于物理和心理两个方面。在降维技术方面,PCA是一种常用的方法,它已被应用于分析化石牙齿数据、大气科学中的海平面压力数据以及数字图像的降维等领域。
1.3 研究方法
1.3.1 样本收集与数据集
数据集来自F - 电商消费者行为分析研究,数据总量增加到656条,包含22个属性。在预处理阶段,部分属性被减少。为了平衡数据集,使用了Python的imbalanced - learning包中的合成少数过采样技术(SMOTE)。以下是部分属性的描述:
| 问题 | 数量 | 百分比 |
| — | — | — |
| 年龄:11 - 30 | 634
超级会员免费看
订阅专栏 解锁全文
595

被折叠的 条评论
为什么被折叠?



