计算机视觉面经【1】

原创

已于 2024-05-09 20:06:38 修改 · 741 阅读

·

16

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉 #人工智能

于 2024-05-07 20:32:51 首次发布

1.Adam和SGD优化器哪个更好，好在哪里，哪个使模型更加容易发散?

Adam优化器：
Adam优化器结合了两种扩展的梯度下降算法：Momentum和RMSProp。
它自动调整学习率，为每个参数计算自适应学习率。
Adam优化器通过计算梯度的一阶矩估计（即均值）和二阶矩估计（即未中心化的方差）来调整每个参数的学习率。
优点：对超参数的选择相当鲁棒，适合不稳定目标函数，适应不同大小的数据集和学习率。
缺点：可能会在训练初期快速收敛，但在后期可能会出现收敛速度慢或者发散的情况。
SGD优化器：
SGD是基础的随机梯度下降算法，它在每次迭代中随机选择一个样本来计算梯度。
SGD通常需要精细调整学习率，并且对初始学习率的选择比较敏感。
SGD有时候可能会在鞍点或者局部最小点震荡，导致收敛速度慢。
优点：在适当的条件下，SGD有可能达到更好的最优点，特别是在大规模数据集和复杂模型上。
缺点：学习率需要仔细调整，可能会在训练过程中卡在鞍点或者局部最小值。

关于模型发散的问题，理论上，如果学习率设置不当，两种优化器都可能导致模型发散。但是，由于Adam优化器会自动调整学习率，它在某些情况下可能比SGD更不容易发散。然而，这并不是绝对的，因为Adam优化器的自适应学习率策略有时候也可能导致在训练后期出现发散。

优化方法总结

2.FPN作用

FPN（Feature Pyramid Networks）是一种用于目标检测和图像识别的神经网络结构，它的主要作用是在不同的尺度上提取特征，以便更准确地检测不同大小的目标。

在深度学习中，卷积神经网络（CNN）通常会在多个层次上提取特征，其中早期的层次捕捉边缘和纹理等低级特征，而更深的层次则捕捉更高级的语义信息。然而，传统的CNN结构在处理多尺度目标时存在

最低0.47元/天解锁文章

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。