当我们在训练模型的时候,有时会因为数据太大造成OOM或者影响效率,generator是Keras的一种解决方案,不仅如此,generator还能在训练时根据需要实时进行数据增强,这次我们继续使用Keras多输入模型实例的代码。
生成器的关键是yield,它能在循环中不停的返回数据,每次返回之前,我们都可以对数据进行操作,比如增加噪音。善用此功能可以增加模型的鲁棒性。首先我们用一个while循环无限跑,因为我们并不知道一共要训练多少次数据。然后每次循环都返回下一组batch_size个数据。与之前不同的是,我们这次使用了dict而不是数组来产生input,dict的key必须与模型中Input的name参数一致。
def data_generator(x1, x2, y, batch_size):
size = len(y)
while 1:
for i in range(int(size / batch_size)):
in1 = x1[i*batch_size: (i+1)*batch_size]
in2 = x2[i*batch_size: (i+1)*batch_size]
out = y[i*batch_size: (i