神经网络优化与正则化技术解析
1. 优化算法与损失收敛
在神经网络训练中,优化算法起着关键作用。以Adam优化的小批量梯度下降为例,它在收敛速度和损失值方面表现出色。通过绘制损失与迭代次数的关系图(如图5.5),可以明显看到Adam优化的小批量梯度下降能更快地收敛到较低的损失值,优于其他方法。
以下是相关代码示例:
xs <- seq(r[1, 1], r[2, 1], length.out = 100)
ys <- seq(r[1, 2], r[2, 2], length.out = 100)
grid <- cbind(rep(xs, each = 100), rep(ys, times = 100))
colnames(grid) <- colnames(r)
grid <- as.data.frame(grid)
predicted <- predict_model(model_minibatch_adam$parameters, t(grid),
hidden_layer_act = "relu", output_layer_act = "sigmoid")
points(grid, col = predicted + 1, pch = ".")
z <- matrix(predicted, nrow = 100, byrow = TRUE)
z <- matrix(predicted, nrow = 100, byrow = TRUE)
contour(xs, ys, z, add = T, levels = 1:(k -
超级会员免费看
订阅专栏 解锁全文

733

被折叠的 条评论
为什么被折叠?



