5、机器学习中的回归与分类应用

机器学习中的回归与分类应用

在机器学习的实际应用中,我们常常会遇到各种问题和挑战,需要运用合适的方法和技巧来解决。本文将介绍一些常见的问题及相应的处理方法,同时探讨分类模型的相关知识。

1. 特征添加与 k - NN 重新运行

在数据处理过程中,我们可能需要添加新的特征。例如,之前选择的特征列是 8、10 到 13 以及 16 列,现在决定将第 1 列的 instant 特征也加入。以下是具体的操作步骤:

# 选择之前的特征列
day1[,c(8,10:13,16)]
# 加载数据
data(day1)
# 添加 instant 特征列
day2 <- day1[,c(1,8,10:13,16)]
# 在新数据上重新运行 k - NN
kno <- qeKNN(day2,'tot',k=5)
# 查看测试集准确率
kno$testAcc

运行结果显示,MAPE 降至约 663,效果有所提升。

在使用 k - NN 等方法时,要注意研究现象的条件可能随时间变化,这可能成为影响预测质量的重要因素。有时候,时间变量可能没有明确体现,而是隐含在记录的顺序中。若不考虑这一点,可能会导致预测质量大幅下降。

2. 数据陷阱
2.1 脏数据问题

脏数据是数据分析中常见的问题。以共享单车数据为例,2011 年 1 月 1 日在 holiday 列中显示不是假期,但在美国这一天是联邦假日。另外,数据集中 weathersit

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值