《探究银行营销行为对用户购买行为影响-基于uplift模型的因果效应研究》数据集与源码
去发现同类优质开源项目:https://gitcode.com/
本项目为网新银行数据建模比赛的资源集合,主要包括数据集和相应的源码文件。数据集涵盖了银行客户在营销行为影响下的购买行为分析所需的全部信息,源码则提供了特征处理和模型分析的具体实现方法。
数据集介绍
数据集由三类数据构成:
- 客户基本信息(x1-x11):可能包含客户的年龄、性别、职业等基本信息。
- 行为类数据(x12-x56):包含客户的交易行为、消费习惯等相关数据。
- 风险评分类数据(x57-x161):反映客户信用的各类评估指标。
数据集分为训练集和测试集,其中训练集包含30,000个样本,测试集包含10,000个样本。每个样本都包括161个特征变量,此外还包括了干预变量(treatment)和响应变量(y)。干预变量将数据集分为实验集(treatment = 1)和控制集(treatment = 0),两者的比例约为1:4。
源码介绍
源码文件包括以下三个部分:
- 随机森林缺失值填充:使用随机森林算法对数据集中的缺失值进行填充。
- Qini曲线绘制:用于可视化模型的提升效果。
- 主程序:包含建立模型、训练及预测等核心逻辑。
通过这些源码文件,可以复现比赛中的数据处理和模型分析过程,进一步深入理解uplift模型在因果效应研究中的应用。
使用说明
请确保在开始使用前,已充分理解数据集的结构和源码中算法的实现细节。使用过程中,遵循数据保护和隐私的相关法律法规,合理使用数据。
本项目基于的比赛数据和研究成果仅供参考和学习使用,未经授权不得用于商业目的。在使用和分享本项目成果时,请遵守相应的知识产权规定。
版权声明
本项目所包含的数据和源码仅供学习和研究使用,未经允许不得用于任何形式的商业用途。版权所有,翻版必究。
去发现同类优质开源项目:https://gitcode.com/
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考