4、sklearn实战的认识

该博客通过sklearn库探讨线性回归模型在广告数据集上的应用。首先使用pandas读取数据,分析各广告投入对销售额的影响,发现广播广告的影响最大。接着,通过train_test_split进行数据划分,并利用LinearRegression建立模型。模型评估显示,广播的系数权重最大,预测效果良好,R方接近1,验证了模型的准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sklearn标准线性回归模型

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.model_selection import train_test_split #模型评估 留出法(最基础的3、7分类的评估形式,这里导入的是模型评估模块)
from sklearn.linear_model import LinearRegression#线性回归
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

#度量导包(训练完之后一定要用的度量工具) mse mae r2(mse是均方值误差,mae是绝对值误差,还有R2的0到1区间误差)

进行pandas的读入

path = r’路径’

data = pd.read_csv(path) # 4列数据
x = data[[‘TV’, ‘Radio’, ‘Newspaper’]]#将电视广告,广播广告,报纸广告作为特征
y = data[‘Sales’]#销售额作为标签
print(x)
print(y)

发掘各种广告投入对销售额的影响哪个是最大的

绘制样本分布,观察效果(其实报纸不适合用作考虑特征,报纸的数据模型呈现的是和销售额不成正比,图像非常的散乱)

plt.plot(data[‘TV’], y, ‘ro’, label=‘TV’)
plt.plot(data[‘Ra

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

T o r

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值