温度预测问题
今天我们将使用一个天气时间序列数据集,它由德国耶拿的马克思 • 普朗克生物地球化学研究所的气象站记录。
目的是给定一些数据,预测24小时之后的气温。
首先,先在https://s3.amazonaws.com/kerasdatasets/jena_climate_2009_2016.csv.zip 下载数据集。
- 查看数据
import os
data_dir = 'C:\\Users\\Administrator\\Desktop\\Keras_learn\\jena_climate'
fname = os.path.join(data_dir,'jena_climate_2009_2016.csv')
f = open(fname,encoding='utf-8')
data = f.read()
f.close()
lines = data.split('\n')
header = lines[0].split(',') #csv文件
lines = lines[1:]
print(header)
print(len(lines))
在这个数据集中,每 10 分钟记录 14 个不同的量(比如气温、气压、湿度、风向等),其中包含多年的记录。
- 解析数据
import numpy as np
float_data = np.zeros((len(lines),len(header)-1))
#第一个元素是记录的时间,不是学习的内容
for i,line in enumerate(lines):
values = [float(x) for x in line.split(',')[1:]]
float_data[i,:] = values
import matplotlib.pyplot as plt
temp = float_data[:,1