
深度学习那些问
文章平均质量分 62
flying_1314
2025持续分享前沿文章~敬请期待~
展开
-
面试常问系列(二)-神经网络参数初始化之自注意力机制
除以dk的本质是对点积结果进行方差归一化,确保Softmax的输入值不会随维度增大而失控,从而保持梯度稳定,提升训练效率和模型性能。这一设计是Transformer高效训练的关键细节之一。原创 2025-03-23 23:36:15 · 1167 阅读 · 0 评论 -
排序-指标解读-roc/auc
带大家搞清推荐系统中排序的常用评估指标的前世今生哦!原创 2022-11-27 22:12:20 · 558 阅读 · 0 评论 -
排序指标解读-GAUC
AUC和GAUC其实是同一类物种,只不过GAUC是个更细心,会考虑到每一个人的更细心的物种,而AUC是更有全局观,以整体为主的物种。原创 2023-03-21 00:54:36 · 580 阅读 · 0 评论 -
第一问-追本溯源求解平方根?
从平方根求解开始打开深度的大门原创 2023-03-12 17:02:50 · 206 阅读 · 0 评论