独热编码和dummy编码的作用

本文探讨了one-hot编码和哑变量编码在模型中的应用差异。当使用one-hot编码时,模型通常不包含偏置项或通过正则化来约束参数;而使用哑变量编码时,模型一般会加入偏置项以保留原有属性。此外,还介绍了特征工程中特征处理的相关知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考这篇文章:

https://www.cnblogs.com/lianyingteng/p/7792693.html

 

总结:我们使用one-hot编码时,通常我们的模型不加bias项 或者 加上bias项然后使用正则化手段去约束参数;当我们使用哑变量编码时,通常我们的模型都会加bias项,因为不加bias项会导致固有属性的丢失

 

这一句话总结,再好好领会。

 

另外这篇文章对于特征的一些处理,也是不错的:

https://www.cnblogs.com/pinard/p/9061549.html

 

特征工程之特征表达

 

转载于:https://www.cnblogs.com/charlesblc/p/10587348.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值