3、如何在添加一个输入变量时最佳地重新训练神经网络-优快云博客

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/152583279

如何在添加一个输入变量时最佳地重新训练神经网络

在机器学习和深度学习的实际应用中，我们常常会遇到需要对已训练好的神经网络进行重新训练的情况。特别是当我们发现一个新的输入变量对目标输出有影响时，如何高效地重新训练网络成为一个关键问题。本文将深入探讨这个问题，并给出相应的解决方案。

1. 问题的提出

在许多现实场景中，一个量 $y$ 的值在很大程度上由相关量 $x_1, \cdots, x_n$ 的值决定。例如，在预测明天的温度时，今天的温度、风速、湿度等因素起着重要作用。在某些情况下，我们可以通过明确的公式或有效的算法来根据 $x_1, \cdots, x_n$ 确定 $y$ 的值，就像在天体力学中预测日食一样。然而，在更多情况下，我们并没有这样的公式或算法，只能依靠大量已知输入 $x_1^{(p)}, \cdots, x_n^{(p)}$ 和输出 $y^{(p)}$ 的模式 $(x_1^{(p)}, \cdots, x_n^{(p)}, y^{(p)})$ 来寻找一个算法 $f(x_1, \cdots, x_n)$，使得对于每个模式 $p = 1, \cdots, P$，都有 $y^{(p)} \approx f(x_1^{(p)}, \cdots, x_n^{(p)})$。这种基于给定模式寻找算法的过程在统计学中称为回归，在计算机科学中称为机器学习。

目前，深度学习是最有效的机器学习工具之一，它使用深度（多层）的人工神经网络。在神经网络中，除最后一个神经元外，每个神经元将其输入 $z_1, \cdots, z_m$ 转换为输出 $t = s(w_1 \cdot z_1 + \cdots + w_m \cdot z_m + w_0)$，其中 $s(z)$ 是一个给定的非线性函数，