8、机器学习中的表格数据回归与时间序列分类

机器学习中的表格数据回归与时间序列分类

1. 表格数据回归

1.1 特征转换与多项式输入组合

在处理表格数据时,有时需要对特定列进行必要的转换。若无法找到合适的匹配,可留空以便尝试所有可能,后续还可添加特征选择步骤。需注意,指数运算符可能会使数值迅速增大到难以处理的程度,因此强烈建议先进行特征缩放。

多项式输入组合是一种有用的特征工程方法。有时,特征组合起来比单独考虑能携带更重要的信息。例如在医疗行业建模时,身高和体重单独来看可能与判断一个人的身体状况无关,但结合起来能更好地描述其身体状态。多项式特征转换通过将每对列相乘生成新特征,还会生成列的平方(列自身相乘)。以下是使用示例:

from tinyml4all.tabular.regression import Table
from tinyml4all.tabular.features import Multiply
# assume the people.csv files contains width (w), height (h)
# and BMI of a group of people
table = Table.read_csv("people.csv")
table.set_targets(column="bmi")
# if you omit the columns parameter,
# all columns will be considered
mult = Multiply(columns=["w", "h"])
table2 = mult(table)

由于乘法可能导致值非常

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值