以下是个人理解,希望进行讨论求解。
练习
1. 如果我们将权重初始化为零,会发生什么。算法仍然有效吗?

根据SGD算法公式如上,第一次迭代的值可知w只与b相关,而对于b的迭代更新,只是与b的初始值相关,x没有参与迭代的计算过程中,不能够达到收敛的目的。
进行运行可以如下结果:


2. 假设试图为电压和电流的关系建立一个模型。自动微分可以用来学习模型的参数吗?
显而易见可行,因为 UR=I,I和U的关系是线性关系。
3. 能基于普朗克定律使用光谱能量密度来确定物体的温度吗?
能基于普朗克定律使用光谱能量密度如下:
