机器学习中的模型评估：回归任务的性能评估

CarlowZJ

已于 2025-04-30 09:32:11 修改

阅读量1.1k

点赞数 15

文章标签：机器学习回归人工智能

于 2025-03-20 21:30:12 首次发布

本文链接：https://blog.youkuaiyun.com/csdn122345/article/details/146406750

版权

前言

在机器学习项目中，回归任务是常见的应用场景之一，涉及预测连续值的目标变量。与分类任务不同，回归任务的性能评估需要使用不同的指标和方法。本文将从回归任务的性能评估指标出发，介绍常用的评估方法，并通过一个完整的代码示例带你入门，同时探讨其应用场景和注意事项。

一、回归任务的性能评估指标

1.1 均方误差（MSE）

均方误差（Mean Squared Error, MSE）是预测值与真实值之间差的平方的平均值。MSE值越小，表示模型的预测误差越小。

MSE=n1i=1∑n(yi−y^i)2

1.2 均方根误差（RMSE）

均方根误差（Root Mean Squared Error, RMSE）是MSE的平方根，用于衡量预测值与真实值之间的差异。RMSE值越小，表示模型的预测误差越小。

RMSE=MSE

1.3 平均绝对误差（MAE）

平均绝对误差（Mean Absolute Error, MAE）是预测值与真实值之间差的绝对值的平均值。MAE值越小，表示模型的预测误差越小。

MAE=n1i=1∑n∣yi−y^i∣

1.4 R²分数（R² Score）

R²分数（R-squared Score）衡量模型对数据的拟合程度，值越接近1表示模型拟合越好。R²分数的范围在0到1之间，值越接近1表示模型的预测能力越强。

R2=1−∑i=1n(yi−yˉ)2∑i=1n(yi−y^i)2

二、回归任务的性能评估代码示例

为了帮助你更好地理解回归任务的性能评估方法，我们将通过一个简单的回归任务，展示如何使用Python和scikit-learn库进行性能评估。

2.1 数据加载与预处理

加载波士顿房价数据集，并进行基本的预处理。

Python复制

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 加载波士顿房价数据集
boston = load_boston()
X = boston.data
y = boston.target

# 数据标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

2.2 训练回归模型

训练一个线性回归模型。

Python复制

from sklearn.linear_model import LinearRegression

# 创建线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)

2.3 计算性能指标

计算均方误差（MSE）、均方根误差（RMSE）、平均绝对误差（MAE）和R²分数。

Python复制

from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import numpy as np

# 预测测试集
y_pred = model.predict(X_test)

# 计算均方误差（MSE）
mse = mean_squared_error(y_test, y_pred)
print(f"均方误差 (MSE): {mse:.4f}")

# 计算均方根误差（RMSE）
rmse = np.sqrt(mse)
print(f"均方根误差 (RMSE): {rmse:.4f}")

# 计算平均绝对误差（MAE）
mae = mean_absolute_error(y_test, y_pred)
print(f"平均绝对误差 (MAE): {mae:.4f}")

# 计算R²分数
r2 = r2_score(y_test, y_pred)
print(f"R²分数: {r2:.4f}")