如何在添加一个输入变量时最佳地重新训练神经网络
在机器学习和深度学习的实际应用中,我们常常会遇到需要对已训练好的神经网络进行重新训练的情况。特别是当我们发现一个新的输入变量对目标输出有影响时,如何高效地重新训练网络成为一个关键问题。本文将深入探讨这个问题,并给出相应的解决方案。
1. 问题的提出
在许多现实场景中,一个量 $y$ 的值在很大程度上由相关量 $x_1, \cdots, x_n$ 的值决定。例如,在预测明天的温度时,今天的温度、风速、湿度等因素起着重要作用。在某些情况下,我们可以通过明确的公式或有效的算法来根据 $x_1, \cdots, x_n$ 确定 $y$ 的值,就像在天体力学中预测日食一样。然而,在更多情况下,我们并没有这样的公式或算法,只能依靠大量已知输入 $x_1^{(p)}, \cdots, x_n^{(p)}$ 和输出 $y^{(p)}$ 的模式 $(x_1^{(p)}, \cdots, x_n^{(p)}, y^{(p)})$ 来寻找一个算法 $f(x_1, \cdots, x_n)$,使得对于每个模式 $p = 1, \cdots, P$,都有 $y^{(p)} \approx f(x_1^{(p)}, \cdots, x_n^{(p)})$。这种基于给定模式寻找算法的过程在统计学中称为回归,在计算机科学中称为机器学习。
目前,深度学习是最有效的机器学习工具之一,它使用深度(多层)的人工神经网络。在神经网络中,除最后一个神经元外,每个神经元将其输入 $z_1, \cdots, z_m$ 转换为输出 $t = s(w_1 \cdot z_1 + \cdots + w_m \cdot z_m + w_0)$,其中 $s(z)$ 是一个给定的非线性函数,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



