实验数据
数据来自出版书籍《An Introduction to Statistical Learning with Applications in R》(Springer, 2013),作者Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani。共200条数据,每条数据4个属性。该数据可以从这个链接直接下载得到:http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv
下载的数据是一个名为Advertising.csv的文件,一共200行4列 。这个是商品的销售量与电视广告、广播广告、报纸广告之间的关系,具体的单位可以先不管。每一行是一个商品,前三列是输入特征,后三列是输出特征。数据的样子如下:
python绘图
使用到了pandas和 matplotlib.pyplot这两个库,没安装的可以用pip安装或者直接安装一个Anaconda。需要吐槽一下我之前好蠢==一直以为是panda,所以很奇怪为什么import panda的时候没有这个库。
首先需要写好Advertising.csv的路径,python里面写路径可以在路径前加一个r,表示不需要转义字符了,比如说:
path = r'C:\Users\***\learning\data\Advertising.csv'
然后使用pandas里面的函数