数据与机器学习面试全攻略
1. 数据处理与流失预测
在数据处理中,我们常常会遇到用户流失预测的问题。以下是一些示例数据:
| user_id | feature_id | feature_value | churn_status |
| ---- | ---- | ---- | ---- |
| 31876 | profile_completion | 55% | 1 |
| 31876 | friend_connections | 127 | 1 |
| 31876 | posts | 42 | 1 |
| 31876 | saved_posts | 3 | 1 |
| 59284 | profile_completion | 92% | 0 |
| 59284 | friend_connections | 95 | 0 |
| 59284 | posts | 63 | 0 |
| 59284 | saved_posts | 8 | 0 |
| 86729 | profile_completion | 75% | 1 |
| 86729 | friend_connections | 58 | 1 |
| 86729 | posts | 31 | 1 |
| 86729 | saved_posts | 1 | 1 |
当有了流失指标的 DataFrame( merged_df )后,需要将其与特征表( features_df )进行合并。接着,可以选择一个简单的机器学习模型,如 CatBoost,并将
超级会员免费看
订阅专栏 解锁全文
1431

被折叠的 条评论
为什么被折叠?



