非常暴露问题的一场面试,把我薄弱的基础和最近浮躁的学习状态揭露无疑。
直接上题目(附上相关的知识点以便以后复习):
-
介绍一下自己
-
你说你用过LSTM模型,请讲一下计算遗忘门的时候,总共有多少需要学习的参数:
思路:矩阵X<t>X^{<t>}X<t> 的形状是(nx,m)(n_x, m)(nx,m),a<t>a^{<t>}a<t>的形状是(na,m)(n_a, m)(na,m),因此stack以后的矩阵 [a<t−1>,X<t>][a^{<t-1>}, X^{<t>}][a<t−1>,<