特征离散化解决非线性特征问题

最新推荐文章于 2024-04-21 15:55:26 发布

转载最新推荐文章于 2024-04-21 15:55:26 发布 · 548 阅读

·

0

·

算法相关同时被 2 个专栏收录

111 篇文章

订阅专栏

105 篇文章

订阅专栏

本文探讨了在使用线性分类器如LR时，通过将连续特征离散化为0/1特征来提高模型拟合能力的方法。通过实例分析，展示了离散化如何帮助线性模型更好地逼近复杂的非线性决策边界。

在实际工作中，需要使用譬如LR这种线性分类器的时候，往往需要将特征离散化成0/1特征，之后再进行模型训练。

下面举例说明原因：

我们假设决策面为y=x^2，且模型是只具有一维特征x的线性模型,即模型的表达形式为：y=kx+b，如下图所示：

显然，模型不能很好地拟合决策面，那么，假如将x离散化成多个0/1特征(one-hot编码)：

0<x<=s1 x1=1,else=0

s1<x<=s2 x2=1,else=0

s2<x<=s3 x3=1,else=0

...

则新的模型表达形式如下：

y=k1x1+k2x2+k3x2+...+knxn+b

这时候新的决策面的表达形式为：

0<x<=s1 y=k1+b

s1<x<=s2 y=k2+b

s2<x<=s3 y=k3+b

...

那么，如下图所示：

经过离散化后的特征训练出来的模型可以更好地拟合决策面。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。