任务要求:
根据不同配置下的汽车使用一加仑的汽油跑的公里数这一数据,来预测一下不同重量的汽车在使用一加仑汽油时跑的公里数。
大致思路:
(1)建立模型:采用sklearn中的线性回归模型,先进行数据训练,得出模型参数之后,再预测一下不同重量下的汽车的行驶公里数(汽车自重越大,行驶公里数越小)
(2)评估模型:对比一下预测值和真实值,计算均方误差mse(mse=(真实值-预测值)^2 (对所有样本点求和))
代码详解:
import pandas as pd
import matplotlib.pyplot as plt
#因为原数据集中没有指标,我需要先指定指标
columns = ["mpg", "cylinders", "displacement", "horsepower", "weight", "acceleration", "model year", "origin", "car name"]
cars = pd.read_table("C:\Anaconda\machine-leaning-data\car-petrol\car.data", delim_whitespace=True, names=columns) #读数据
print(cars.head(5))
#进行数据可视化展示
fig=plt.figure()
ax1=fig.add_subplot(2,1,1)
ax2=fig.add_subplot(2,1,2)
cars.plot("weight","mpg",kind='scatter',ax=ax1) #画一个关于汽车油耗和重量的散点图
cars.plot("a