其中块的大小代表模型的复杂程度,五角星代表最优值 如果盲目的去堆加模型的复杂程度并不一定会提升模型的精度 但如果我们新的模型总是包含旧的模型,那么它的精度至少不会变差(通常情况下更好) 残差块 串联一个层改变函数类,我们希望能扩大函数类 残差块加入快速通道来得到 g(x)=x+f(x)g(x)=x+f(x)g(x)=