银行电话营销客户订阅评估:从数据到模型
1. 项目背景与目标
在全球金融危机的背景下,银行获取国际市场信贷变得更加困难,因此将注意力转向内部客户及其存款以筹集资金。这就产生了对客户存款行为以及他们对银行定期电话营销活动响应信息的需求。本项目的目标是实现一个机器学习模型,预测客户是否会订阅定期存款,这本质上是一个二元分类问题。
2. 数据集介绍
该数据集最初用于Moro等人2014年发表的研究论文,随后被捐赠给UCI机器学习库。数据集有四个版本:
| 数据集名称 | 示例数量 | 输入数量 | 说明 |
| — | — | — | — |
| bank - additional - full.csv | 41,188 | 20 | 包含所有示例,按日期排序(2008年5月至2010年11月),与Moro等人分析的数据接近 |
| bank - additional.csv | 4,119 | 20 | 随机选取10%的示例 |
| bank - full.csv | 全部 | 17 | 按日期排序,旧版本,输入较少 |
| bank.csv | 10% | 17 | 随机选取,旧版本,输入较少 |
数据集中有21个属性,独立变量可进一步分类,因变量为 y ,表示客户是否订阅定期存款。具体属性如下:
| ID | Attribute | Explanation |
| — | — | — |
| 1 | age | 年龄(数字) |
| 2 | job | 工作类型(分类,如admin、blue - collar等) |
超级会员免费看
订阅专栏 解锁全文
1473

被折叠的 条评论
为什么被折叠?



