天池大赛—天猫用户重复购买预测赛题
文章平均质量分 77
jialun0116
浙江工业大学
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
天猫用户重复购买预测赛题——特征优化 最终结果 148/0.6812
天猫用户重复购买预测赛题——特征优化结果理论知识1. 读取数据 并 缺失值补全2. 构建验证函数3. 删除方差较小的特征 Filter->Variance Threshold4. 基于单变量统计检验选择最佳特征 Filter->SelectKBest5. 递归功能消除 RFE6. 使用模型选择特征 SelectFromModel天池大赛比赛地址:链接结果理论知识可参考特征优化特征选择 也称为变量选择、属性选择 ,是为了构建模型而选择相关特征(即属性、指标)子集的过程目原创 2021-01-11 12:55:01 · 3882 阅读 · 2 评论 -
天猫用户重复购买预测赛题——模型训练、验证和评测
天猫用户重复购买预测赛题——模型训练、验证和评测理论知识1. 设置交叉验证方式2. 模型调参3. 不同的分类模型4. 模型融合5. 训练并验证6. 初步结果天池大赛比赛地址:链接理论知识分类是一个有监督的学习过程,在大量带标签数据的前提下,计算出未知样本的标签取值,二分类和多分类问题逻辑回归 虽然叫回归 但是属于分类算法 通过将线性函数的结果映射到Sigmoid函数中 预估出概率并分类Sigmoid函数是归一化函数,将连续数值转化为0到1的范围,连续型–>离散型回归函原创 2020-12-25 15:31:28 · 5493 阅读 · 2 评论 -
天猫用户重复购买预测赛题——特征工程
天猫用户重复购买预测赛题——特征工程构建的特征有理论知识1. 导入相关包 和 数据2. 对数据进行内存压缩3. 合并训练集、测试集、用户信息表和用户动作表4. 定义特征统计函数5. 构建用户画像6. 构建用户和目标商家的特征7. 构建商家特征8. 特征融合比赛链接构建的特征有‘label’,‘merchant_id’,‘user_id’,‘user_item_counts’,‘user_cat_counts’,‘user_seller_counts’,‘user_seller_unique_原创 2020-12-21 21:16:56 · 5839 阅读 · 2 评论 -
天猫用户重复购买预测赛题——赛题理解 + 数据探索
天猫用户重复购买预测赛题——赛题理解 + 数据探索理论知识1. 赛题信息2. 评估指标 AUC3. 查看数据样例4. 缺失值查看5. 查看数据分布6. 探究影响复购的各种因素理论知识双十一进行促销,商家希望知道那些用户可能会成为重复购买其店铺商品的忠诚用户,从而精准营销可以用复购率来衡量店铺的用户忠诚程度复购率 = 重复购买用户数/用户样本数量复购率= 重复购买行为次数/用户样本数量100用户 20复购行为 10复购1次 10复购2次 方法1:20/100 方法2:(10x1+10x2原创 2020-12-10 12:41:26 · 12841 阅读 · 2 评论
分享