21、深度学习中的关键技术与应用

原创于 2025-11-10 13:17:51 发布 · 22 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #Softmax #交叉熵

从零构建数据科学专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度学习中的关键技术与应用

1. 模型训练基础

在深度学习训练过程中，通常会进行如下操作来更新模型参数：

epoch_loss = 0.0
for x, y in zip(xs, ys):
    predicted = net.forward(x)
    epoch_loss += loss.loss(predicted, y)
    gradient = loss.gradient(predicted, y)
    net.backward(gradient)
    optimizer.step(net)
accuracy = fizzbuzz_accuracy(101, 1024, net)
t.set_description(f"fb loss: {epoch_loss:.2f} acc: {accuracy:.2f}")
# Now check results on the test set
print("test results", fizzbuzz_accuracy(1, 101, net))

经过1000次训练迭代后，模型在测试集上可达到约90%的准确率。若增加训练次数，准确率可能会进一步提高。不过，仅使用25个隐藏单元可能难以达到100%的准确率，而增加到50个隐藏单元时则有可能实现。

2. Softmax与交叉熵

在分类问题中，传统的以Sigmoid层结尾的神经网络，其输出是0到1之间的向量，可能出现全为0或全为1的情况，这在分类任务中难以解释。为了输出各类别的实际概率分布，通常会舍弃最后的Sigmoid层，转而使用softmax

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。