机器学习 (十六)电商O2O优惠券使用预测-2

本文是关于电商O2O优惠券使用预测的分析,重点介绍了数据清洗、特征选择和模型选择。通过Python进行数据分析,提取了用户和商户的多个特征,如消费日期、距离、折扣率等,并探讨了模型如逻辑回归、LGBMClassifier在项目中的应用。强调了特征工程在提高模型效果中的重要性,并分享了个人在项目过程中的思考,认为行动习惯而非道理更能影响人生。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

介绍

       这篇文章是想继续总结一遍优惠券预测,写写感受并进行一个记录总结,零零散散以作为记录整理之用。

本篇是选了三点本人觉得项目中重要的写了一下,其它内容暂时略过

  • 第一部分:数据清洗数据分析代码基本功
  • 第二部分:特征理解和选择
  • 第三部分:模型选择和调休

数据分析利器-python

       在用python进行数据分析时候,确实发现其有很多方便之处,其强大的函数处理功能,正看在《利用python进行数据分析》这本书发现还是不错的,简单内容如下:

在这里插入图片描述

在这里插入图片描述
笔记:

  • copy
    用在了提取特征地方,复制一份数据单独处理,不影响以前的,默认深复制
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
frame = pd.DataFrame(data)
print(frame)
# 深复制 修改不影响原对象
data_deep_copy = frame.copy()

data_deep_copy.iloc[1] = 2018
print(data_deep_copy)
print(frame)

# 浅复制  修改影响原对象
data_shallow_copy = frame.copy(deep = False)
data_shallow_copy.iloc[1] = 2019
print(data_shallow_copy)
print(frame)

-梳理
分组
在提取用户特征时,根据User_id进行分组,得到分组对象,然后可以再分组对象上进行各种统计操作。

# 用户 User 特征
u = fdf[['User_id']].copy().drop_duplicates()

# u_coupon_count : num of coupon received by user
u1 = fdf[fdf['Date_received'] != -10][['User_id']].copy()
# 每个用户领取
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李龙生的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值