作业写多了,删掉很浪费,遂发出来,作业很青涩,绝对不会百分之百的对。仅为不浪费的处理方法,放上来作为我的来时路。
———————————————————————————————————————————
Question:周末购物行为与工作日有何系统性差异?如何运用这些差异优化零售运营策略?
1. 研究问题 (Intriguing Question)
"周末购物行为与工作日有何系统性差异?如何利用这些差异优化零售运营策略?"
2.数据处理
2.1数据清洗
- 把顾客分为会员和非会员部分分为两个表
- 对于会员部分的vlookup联合LOYALTY和POS DATA_Valid_Card两个表。把顾客的信息迁移到表中。于此同时把商品的购买信息联立POS DATA_Valid_Card和Barcode两个表
- 对于非会员的部分,只是存在联立Barcode和POS DATA_Missing_Card两个表
- 加一列trading record,完成交易的部分标记1,未完成交易的部分标记0
- 在POS DATA_Missing_Card 加一列return作为退货记录,未退货的标记为1,退货的也就是,Value<0的标记为0,未完成交易的标记为2
- 删除分类信息为空的部分,两个sheet为:POS DATA_Valid_Card和POS DATA_Missing_Card,在这个之后查看剩下数据中barcode中长度不足12的部分予以删除,剩下的数据写到一个新的excel中分开各自的sheet,输出一个完整的excel表格。
- 对于家庭成员数量大于12的部分数据,予以删除。
2.2数据整合
在对购物篮数据进行深入分析之前,首先需要对原始数据进行合理清洗和结构化整理,以保证后续模型构建与统计分析的准确性和可解释性。本研究在数据导入后,依照以下步骤进行了前期处理:
- 过滤异常与无效记录,为确保只分析实际购买行为,本研究仅保留了 Sum_Units > 0 且 Sum_Value > 0 的记录。即,仅保留含有实质性消费且未发生退货的交易。这一环节可以排除异常值、退货记录和空购物篮,保证数据的分析质量。
- 构建关键时间维度变量,由于本问题针对的是“周末效应”将原始的日期字段 (Date) 转换为标准格式,便于后续按天、周等维度聚合。创建了 IsWeekend 变量,用于标识记录是否发生在周末。该变量是后续分析“周末效应”的基础。
- 划分持卡会员与非会员,基于是否存在有效的 Card_ID,创建 HasCard 字段,将顾客分为会员 (HasCard = 1) 和非会员(HasCard = 0)两类。这将有助于我分析是否存在“会员行为”和“周末效应”的交互作用,为个性化营销分析奠定基础。
- 合并表格与统一结构,原数据已经清洗了的两部分数据源分别来自“带会员卡购买记录”与“无会员卡购买记录”,结构上基本一致。在清洗完成后,将它们合并成统一的数据框 combined,便于整体分析。合并后的数据保留了交易号、日期、购买数量、购买金额、是否周末和是否持卡等核心变量。
- 聚合至“购物篮”层次,由于本研究关注的是购物篮整体特征,因此按 Basket_ID 聚合,得到每个购物篮的总购买数量 (Total_Units)、总消费金额 (Total_Value) 以及平均单价 (Avg_Unit_Value)。
本报告全程使用R语言和excel作为分析工具。
3.数据基本描述和是否会员的差异性分析
3.1 描述性分析
- 购物篮规模对比:周末 vs 工作日
经过对数据的清洗,我对数据进行了周末和工作日的基本划分,由下表所示:
|
Day Type |
Mean Units |
Median Units |
Std Units |
Count |
|
Weekday |
6.16 |
5 |
4.94 |
33,559 |
|
Weekend |
5.95 |
4 |
4.99 |
12,064 |
从上表能看见,工作日和周末之间的差异很小,几乎可以认为没有明显的差异。有可能不具备“周末大购物”典型周末效应的特征,可能该店的顾客购物行为比较稳定或者是周末出现更多的“小额快速购买”行为。
|
Day Type |
会员状态 |
Mean Units |
Median Units |
Count |
|
Weekday |
非会员 |
4.56 |
3 |
15055 |
|
Weekday |
会员 |
7.46 |
6 |
18504 |
|
Weekend |
非会员 |
4.62 |
3 |
7421 |
|
Weekend |
会员 |
8.07 |
7 |
4643 |

从这张图和上面的会员和非会员对比表可以得出,有卡用户平均购买量大于无卡用户,说明会员身份会在一定程度上影响篮子的大小。从表层看周末效应不是那么地明显,但是后面会使用专业的统计检验来验证周末效应的问题。

这张箱线图显示,虽然工作日与周末的购物篮规模在中位数与整体波动程度上相似,但周末的平均值略高,并且出现更多的高值离群点。这表示大多数顾客在周末与工作日的购买数量相近,但仍有一部分顾客会在周末进行更大规模、成批量的购物。
3.2商品单价分析:价格敏感度的时间差异

而对于平均价格来说,顾客的平均花费工作日可以从上图看见显著高于非工作日。

会员在工作日购买的商品平均单价明显更高,说明他们更倾向于在工作日进行计划性、价值更高的消费。到了周末,会员平均单价下降,可能转向补货、简单采购等日常购物。相比之下,非会员的消费单价在周末和工作日之间几乎没有变化,显示其购物模式更随性、更价格敏感度较低,于此同时也缺乏明显的‘高价值购物时段’。这意味着,针对会员的高价位产品促销更适合放在工作日,而针对非会员的推广活动则不必过度区分时间。
3.3会员和非会员行为模式:忠诚度高和低的客户的时间偏好
通过对会员和非会员的购物行为的统计,得出下图:

非会员的购物行为更随意,大概三分之一的交易发生在周末,说明他们更可能在休息日顺便购物。相比之下,会员的购物模式更稳定,他们有将近 80% 的交易发生在工作日,几乎不会把购物集中在周末。这表明会员更倾向于在日常生活中进行计划性的采购,而非会员的购物更接近“周末顺道买点东西”的形式。
3.4交易频次分布:消费时间集中度

从整体交易频次来看,会员与非会员在一周中的购物模式存在显著差异。会员的购物节奏更加规律,工作日维持稳定的购买水平而在周五与周六出现明显高峰,它显示出更强的计划性和周末集中采购特征。相比之下,非会员的行为更为分散和随意,唯一突出的峰值出现在周二,其余时间的波动较小,包括周末在内也未呈现明显提升。这表明会员更倾向于规律性和计划性的消费,而非会员更可能是机会型购物者。基于此可考虑在工作日(尤其是周末前夕),加强对会员的价值提升活动;针对非会员则可围绕周二或周末强化引流和促销策略。
4.模型构建与分析
4.1预测建模
- T检验:识别周末效应
为了进一步检验是否真的具有统计学意义上的周末效应,也就是周末和工作日的零售数据是否真的在周末和工作日有差别,本研究分别对购物篮大小和商品单价进行了t-test检验,结果如下表:
|
Metric |
t-value |
p-value |
Conclusion |
|
Basket Size,Units |
-3.97 |
7.15×10-5 |
significant |
|
Unit Price |
-10.9 |
<2.2×10-16 |
significant |
T-test结果表明,周末购物篮子平均更小、商品单价更低,两项差异均达到了显著水平,说明存在明显的“周末效应”。
4.2逻辑回归模型:预测周末购物概率
为了预测周末购物概率,搭建逻辑回归模型。
模型结果如下表:
|
变量 |
系数 |
影响方向 |
解释 |
|
Total_Units |
0.0107 |
正向 |
篮子越大 ,稍微更可能周末购物 |
|
Avg_Unit_Value |
-0.0238 |
负向 |
商品越贵 ,越不可能是周末 |
|
HasCard |
-0.7033 |
负向 |
会员更倾向于工作日购物 |
逻辑回归模型用于预测一笔交易是否发生在周末,包含三个关键变量:购物篮大小(Total Units)、平均商品单价(Avg Unit Price)以及会员身份(HasCard)。
模型整体具有统计显著性,AIC = 36113,说明具备较好的解释能力。
从系数图可以看出:
- 购物篮越大,越有可能发生在周末(p < 0.001)
- 商品单价越高,越不可能发生在周末(p < 0.001)
- 会员明显更倾向于在工作日购物(p < 0.001)
计算模型准确率为73.4%,模型准确率较高。

模型的 AUC 为 0.591,说明其预测周末购物的能力有限,仅略高于随机水平。换言之,购物篮规模、商品单价与会员身份虽然在统计上与周末购物存在显著关联,但这些变量的解释力不足以构建高准确度的预测模型。这一结果表明:顾客选择在周末或工作日购物并不主要由购买特征驱动,而更多是受个体时间安排、生活方式等外部因素影响。
对于周末的重点策略是建议推广大包装和家庭装商品,设计“周末家庭套餐”优惠,开展多件折扣、满减活动等;对于工作日则是主打高端商品和进口商品,推出工作日精品专区,设置会员专属折扣时段等。
4.3细分分析
- 高价值 vs 低价值客户的购物时间偏好
这里把消费金额在前20%的客户定义为高价值客户,而剩下的80%的用户定义为标准价值客户。基于此展开进一步分析:
1)不同价值客户之间的数量差异对比

从图中可以看出,高价值客户的购物篮规模远高于标准客户,他们是整体销量贡献的核心群体。他们在工作日与周末的购买量保持一致,属于稳定高消费用户,相反的是标准价值客户无论在何时段购买的数量都较低且差异不明显。策略上应重点维系高价值客户,通过会员计划、个性化优惠或提前推送高价值产品,以进一步提升其贡献;同时对标准用户可以通过周末促销引导增加购买量。
2)不同价值客户之间的价格对比

高价值客户不仅购买量更大(basket size 高出 2–3 倍),在商品选择上也更倾向于高单价产品,是盈利能力最强、最关键的一群顾客。他们在周末与工作日的价格表现虽有变化,但整体仍显著高于其他客户。标准价值客户的消费偏好以低价、刚需品为主,几乎不随时间变化。营销策略上应将高价值客户视为“可提升型 Premium Segment”,给予个性化推荐与高端品类的定向推广;而标准客户更适合以折扣、组合促销驱动成交。
- 不同价值客户的时间偏好差异

高价值客户的周末购物占比较低(24.8%),明显低于标准价值客户(26.8%)。这说明高价值客户的消费行为更倾向于工作日、节奏更稳定,而标准价值客户更受周末时间影响。营销上可在工作日针对高价值客户推出个性化促销或会员专属活动,以稳住高贡献群体;周末则更适合面向标准价值客户进行大众化引流与折扣活动。
4)会员与非会员的不同价值顾客对比

分析结果显示,会员与客户价值对周末购物存在明显交互效应。非会员无论价值高低都更偏向周末购物,尤其是标准用户(33.5%)。相比之下,会员明显倾向在工作日购物,其中标准会员周末比例最低(18.9%)。此外,高价值客户在两个会员组中都表现出更低的周末购物比例,说明其消费行为更规律、更稳定。整体来看,周末营销活动更适合面向非会员和标准价值客户,而工作日营销应重点服务高价值会员群体。
5. 信息图元素
5.1周末购物者画像
由于数据只提供了会员卡持有者的相关用户特征,包括性别和家庭情况等,这里只能对会员做基本的用户画像分析。

图表显示,会员的周末与工作日人口属性整体差异不大,存在清晰趋势:
1)工作日购物的会员更“家庭型”:女性更多、年龄略大、有孩家庭比例更高;
2)周末购物的会员更“年轻&男性化”:女性占比下降,年龄略低。
这表明周末与工作日的购物行为差异并不是由家庭规模或婚姻状况驱动,而更多受个人时间安排、年龄结构以及性别角色分工影响。对于营销策略而言,工作日更适合推行面向中高龄女性、有孩家庭的活动,而周末则更适合年轻群体与男性客群。

年龄结构显示会员整体以 35–54 岁为核心,但不同年龄段在“工作日 vs 周末”的选择上呈现分化趋势:年轻会员(18–34)明显偏向周末购物,而年长会员(65+)显著偏向工作日购物。中间段(35–64)占比最高,但其中 45–54 岁与 55–64 岁在周末的占比也有所抬升。这说明周末更适合触达年轻与中年家庭客群,而工作日则是高龄客群与高价值会员的主要活跃时段,可据此制定更精准的时间分段营销策略。
总结后得出
- 周末购物会员的特征:47.5岁,55.5%为女性;大约为2-3人家庭,其中32.9%的家庭有孩子,画像描述更像是家庭的主妇或者主夫,负责全家采购。
- 工作日购物会员特征:平均年龄49.1岁,62.7%为女性,为2-4人的家庭,其中34.4%的家庭有孩子,画像整体总结描述为上班族,个人或者小家庭的即时需求。
基于上述分析,给出精准营销的策略建议:
周末:准备更多的家庭装商品以及儿童用品,采取多买多优惠的策略刺激销售。
工作日:准备更多的个人用品、生活用品即时食品库存,摆放位置更靠近结账台为顾客提供便捷服务。
6.总结
周末效应分析不仅揭示了显著的购物行为时间差异更为零售企业提供了数据驱动的优化机会,通过精准的库存管理、差异化的营销策略和优化的服务配置,企业可以显著提升运营效率和客户体验,最终实现销售增长和竞争优势建立。
从本研究中可以看出该数据集存在明确且显著的“周末效应”,本研究从购物篮规模、商品单价、会员行为、价值客户细分、人口特征及预测模型等多个维度系统性分析周末和工作日的购物行为差异。得出以下主要结论:
(1)“周末效应”被证实确实存在,它规模略小分布较为分散而且出现了更多大额购入的离群点,说明周末既有轻量化采购同时也存在部分的“大采购”。商品单价在周末显著下降,表明顾客在周末更偏向购买价格低,日常补货型商品。
(2)会员与非会员的购物节奏完全不相同。对于会员来说80%的购物发生在工作日,消费更为计划化也倾向购买高单价商品。而对于非会员来说大概33%的购物发生在周末,行为更为随意以机会型购物为主。
(3)价值客户的购物特征趋向一致,但稍有不同。高价值客户(前20%)购物篮数量比标准客户高出2-3倍,并且他们倾向于选择更高单价的商品,是收入贡献的核心。于此同时,本研究还发现高价值客户更倾向在工作日购物,购物规律且稳定。但是对于标准价值的客户来说,他们更依赖在周末时段进行补货和集中采购。
(4)会员和客户价值有产生强交互效应,非会员标准价值的客户比会员高价值客户依赖于周末购物(约有33.5%的人),而会员高价值客户最依赖工作日(仅有23%),这也表明在一定程度上,本店适合差异化营销。
(5)人口结构显示周末更年轻,工作日更多的家庭型用户。周末购物的会员会更年轻、女性比例会更低。而工作日,女性、家庭、有孩子的比例更高,显示家庭的采买行为。
运营建议:
- 周末应该以年轻、标准价值、非会员并且高价格敏感的客户为目标,推出价格敏感型促销(比如多件多折扣、买满价格减少多少、家庭装等),重点投放跨品类补货商品(米面粮油、牛奶、水、清洁用品等)提供入会奖励,鼓励周末客群转化为会员。于此同时可以加大宣传力度,在社交媒体、App推广短促快销活动。
- 工作日的目标客群是高价值客户以及会员群体,尤其是中年家庭客户。可以推出“会员工作日专属优惠”比如进口商品、健康食品以及高端饮品等的打折优惠活动。通过会员数据,在手机App提供相关定制化推荐。以及通过整合服务管理,提高工作日的购物体验(比如优化购物体验,在排队和购物检索等方面)。而且在之后可以开启工作日预付式套餐或者订阅制度,可以减少现场挑选的时间提高购物体验。
- 对于产品的库存来说,在周末应该提高补货型商品的备货,以及低价、高周转商品,还有一些大包装和家庭装的产品库存。对于工作日来说,应该补充高价格和高利润的商品品类,增加对于新品和进口商品的展示。让库存整体上与客户群体需求匹配,减少滞销与缺货造成的损失。
960

被折叠的 条评论
为什么被折叠?



