100Days的学习用的都是PyCharm工具
数据预处理
我们先看下数据:Data.csv, 相应的数据可以在:https://github.com/Avik-Jain/100-Days-Of-ML-Code/blob/master/datasets/Data.csv 中下载(右击“Raw”然后另存为即可)
1.导入需要的库:NumPy和Pandas,前者里边包含了很多数学中的计算函数,后者是用来导入和管理数据集的;
import numpy
import pandas
2.导入数据集:通常都是.csv格式的,可以用Pandas的read_csv方法进行读取,每一个metrics都会包括两个部分,独立变量(independent-variables)和依赖变量(dependent-variables), 即自变量和因变量;
#文件我给的是存储在我的电脑里的路径,默认就是带有header的,如果表中无header,那么加一个:header= None即可
dataset = pandas.read_csv(