💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在优快云上与你们相遇~💖
本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】
Sklearn 机器学习多项式特征实战:从单变量到多变量
在实际的机器学习项目中,特征工程起着至关重要的作用。线性模型仅能拟合特征与目标变量之间的线性关系,无法捕捉非线性模式(如二次曲线、交互效应等)。此时,构造多项式特征(Polynomial Features)可以有效增强模型拟合能力,使得线性模型也具备拟合复杂非线性关系的能力。
本文将通过 sklearn.preprocessing.PolynomialFeatures
模块,讲解如何基于 单个变量 和 多个变量 构造多项式特征,并结合可视化分析模型拟合效果。
🧠 一、什么是多项式特征?
多项式特征是通过对原始特征进行幂次扩展与交叉组合生成的新特征。
例如:输入特征 $x$,若设置多项式次数为 2,生成的特征为:
x → [ 1 , x , x 2 ] x \rightarrow [1, x, x^2] x→[1,x,x2]
若设置
include_bias=False
,偏置项1
将被省略,实际生成特征为[x, x^2]
。
对于两个特征 $x_1, x_2$,设定次数为 2 时:
[ x 1 , x 2 ] → [ 1 , x 1 , x 2 , x 1 2 , x 1 x 2 , x 2 2 ] [x_1, x_2] \rightarrow [1, x_1, x_2, x_1^2, x_1x_2, x_2^2] [x1,x2