作业说明
数据:train.csv 训练集,包含1年*12个月*20天*24小时*18种污染物的测试值
test.csv 测试集, 包含240个例子*18种污染物*9小时的测试值
ans.csv 结果集, 是测试集内容应该有的结果,即标准值,包含240个数字
题目简述:给出训练集,要求使用梯度下降的方法,建立一个模型,输入数据是空气污染物连续九个小时含量,输出数据是连续九小时之后的第十个小时的PM2.5的含量(如输入是1-9小时,则输出第10小时,输入2-10小时,输出第11小时)。使用我们训练的模型,对测试集进行处理,得出我们的预测值。我们可以用结果集对比我们的预测值,看我们的模型的优秀程度。
学习资料:李宏毅作业及作业数据来源
线性回归预测PM2.5----台大李宏毅机器学习作业1(HW1)
解题步骤
1.数据处理
数据中给了有效数据(12个月*20天*18个污染物)行、(24小时)列。我们以连续10个小时训练,前9个是训练数据,第10个是标准答案。