面试题集锦
文章平均质量分 90
flying_1314
2025持续分享前沿文章~敬请期待~
当前主要侧重,图神经网络,大模型相关论文讲解,后续大家如果有感兴趣的方向,欢迎评论区讨论
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
面试常问系列(一)-神经网络参数初始化-之自注意力机制为什么除以根号d而不是2*根号d或者3*根号d
通过上述的不同缩放比例,大家应该可以比较清晰的发现,以一个标准差(68.26%)为例,随着缩放比例加大,变化范围减小,点击值被过度压缩,导致相对趋于均匀,从而无法很好的捕捉不同特征之间的差异,趋于大家都一样的感觉,区分度被缩小。大家感兴趣的可以实操看一下,softmax在不同缩放比例下的分布情况。原创 2025-05-06 19:05:57 · 747 阅读 · 0 评论 -
面试常问系列(一)-神经网络参数初始化之自注意力机制
除以dk的本质是对点积结果进行方差归一化,确保Softmax的输入值不会随维度增大而失控,从而保持梯度稳定,提升训练效率和模型性能。这一设计是Transformer高效训练的关键细节之一。原创 2025-03-23 23:36:15 · 1497 阅读 · 0 评论 -
编程——无序数组中找到最大乘积(python)
题目给定一个无序数组,包含正数、负数和0,要求从中找出3个数的乘积,使得乘积最大,要求时间复杂度:O(n),空间复杂度:O(1)输入描述:输入共2行,第一行包括一个整数n,表示数组长度第二行为n个以空格隔开的整数,分别为A1,A2, … ,An输出描述:满足条件的最大乘积示例:输入:43 4 1 2输出:24思路确定5个数,如果都是正数则,...原创 2020-05-06 12:09:32 · 1086 阅读 · 0 评论 -
笔试题——max pooling滑动窗口实现(python 代码)
题目输入:从控制台获取n,m,a,b;其中n*m为矩阵大小,a*b为滑动窗口大小 矩阵中的值,通过(i*j)mod 10 得到, 在滑动过程中,需要获得每次滑动窗口中的最大值,并存储下来 输出:所有最大值的和要求及思路纯暴力求解法,时间复杂度过高,需要使用滑动窗口方法求解 题目为2维矩阵,所以需要对行和列依次使用滑动窗口方法即可 不了解滑动窗口的可以参考一维滑动窗口这篇文章源...原创 2020-04-21 16:47:24 · 1428 阅读 · 0 评论
分享