利用Python训练自定义机器学习模型
1. 业务用例:客户流失预测
在电信公司的业务场景中,客户流失预测是一个重要的问题。客户流失指的是客户停止使用服务的比率,对于按月或按年签订合同的电信公司来说,流失表现为客户在下个月取消订阅或合同。我们使用的数据集是IBM Telco客户流失数据集,它包含21列,既有数值变量,也有分类变量。以下是数据集的部分列信息:
| 列名 | 列类型 | 字段值说明 |
| — | — | — |
| customerID | String | 每个客户的唯一值 |
| gender | String | “male” 或 “female” |
| SeniorCitizen | Integer | 1表示客户是老年人,0表示不是 |
| Partner | String | 记录客户家庭中是否有伴侣 |
| Dependents | String | 记录客户家庭中是否有受抚养人 |
| tenure | Integer | 客户使用电信服务的月数 |
| PhoneService | String | 记录客户是否支付电话服务费用 |
| MultipleLines | String | 如果客户支付电话服务费用,是否支付多条电话线费用 |
| InternetService | String | 客户支付的互联网服务类型(如果有) |
| OnlineSecurity | String | 客户是否支付在线安全服务费用 |
| OnlineBackup | String | 客户是否支付在线备份服务费用 |
| DeviceProtection |
超级会员免费看
订阅专栏 解锁全文

2975

被折叠的 条评论
为什么被折叠?



