2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案

本文探讨了数据预处理中的数据清洗方法,并介绍了如何选择适当的特征进行分类与回归任务。针对正样本过少的问题,文章对比了深度模型与传统方法如SVM的效果,并提出了采用广义线性回归作为解决方案。
部署运行你感兴趣的模型镜像

2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案
1、数据需要清洗
注意在读取csv格式文件之后需要对空值进行补全类似如下代码:
2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案
2、特征工程
此处选取以下几个指标作为分类和回归的特征
2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案
3、深度模型失效
通过日志发现 正样本即Y>0的样本所占比例在14%左右,深度分类模型可能将所有的数据分为Y=0导致没有数据进行回归

所以此处采用传统方法 使用SVM 方法和 决策树进行分类
进过测试发现SVM效果较好

4、正样本过少
考虑将回归模型改为广义线性回归 放弃深度模型
或者 改变 先分类后回归的模式 下采样 解决问题

转载于:https://blog.51cto.com/yixianwei/2120336

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值