- 博客(249)
- 问答 (2)
- 收藏
- 关注
原创 transformer的基础知识
一般Seq2seq会分成两部分:Encoder、Decoder。Transformer 中的 Encoder 就是用的 Self-attention。encoder的内部结构补充:block的内部结构主要由self-attention和全连接神经网络所构成。在原来的论文中block的结构更加复杂。现在就比较好理解了,feed forward网络(ffn网络)结构图补充:Feed Forward 网络在 Transformer 中起到对特征进行进一步处理和增强的作用。自回归 Autoregressi
2024-10-14 12:23:30
1059
原创 自注意力机制基础知识
输入矩阵I=(a1,a2,a3)分别乘以三个w得到三个矩阵q,k,vA=QK^T,经过softmax层后得到注意力矩阵A`输出O=A`V。
2024-10-14 12:11:18
829
原创 lstm基础知识
LSTM(Long short-term memory)通过刻意的设计来避免长期依赖问题,是一种特殊的RNN。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!在标准的RNN中,这个重复模块具有非常简单的结构,例如只有单个tanh层,如下图所示。LSTM具有同样的结构,但是重复的模块拥有不同的结构,如下图所示。与RNN的不同,这里有四个网络层,并且以一种非常特殊的方式进行交互。
2024-10-14 12:04:56
486
原创 LeetCode 15. 三数之和
这道题大体的思路是和LeetCode第16题是一致的,利用三指针法,最主要的差别是去重操作。我们要对i,l,r进行去重操作。
2024-04-12 00:31:12
379
原创 LeetCode 61. 旋转链表
即为[1 2 3 4 5 1 2 3 4 5]然后直接从中截取一份就行了。我们呢可以将[1 2 3 4 5]复制一份,并将两份进行连接,我之前刷计算机二级c语言有道题目的思路和这道题大致一样。求[1 2 3 4 5] k=2时的样子。
2024-04-12 00:27:40
216
原创 LeetCode 206. 反转链表
temp这个节点可能存在,也可能不存在.y总的写法不用去过多地去考。这道题我的写法和y总的写法大致一致,但是我觉得他的写法比较好,虑p3或者是temp节点的情况。
2024-04-12 00:26:53
250
原创 LeetCode 22. 括号生成
1 在这字符串的前缀中,左括号的数量大于等于右括号的数量。当添加左括号的数量大于右括号的数量,此时可以添加右括号。2 左括号,右括号的数量分别不超过n。做括号这一类型的题应该记住两个结论,
2024-04-12 00:23:50
176
原创 LeetCode 119. 杨辉三角 II
当把数组转化成集合的时候,数组的数据类型应该是基本数据类型的包装类,1 Array.asList(数组名)。//将数组转化成集合。打表法,,有几个小细节是要注意一下。2 二维数组的定义初始化方式。
2024-04-12 00:18:49
333
原创 AcWing 1381. 阶乘
12的最后一位时2, * 15=30,则为3,问题是12*15=180,为8,两。最后一位数相乘的变化。注意:为什么不是s=s%10,如果12 * 15,者不符,说明s=s%10中的10要多加0.
2024-04-11 00:41:04
141
原创 AcWing 1353. 滑雪场设计
这道题的思路是,所有的点最终都在[i,i+17]的区间中。所以我们要枚举所有的区间,来算出所花费的最小金额。
2024-04-11 00:40:21
168
原创 LeetCode 377. 组合总和 Ⅳ
而背包问题是无序的,但是我们也可以用dp分析法来分析。之前一直以为这是背包问题,后来发现,这个是有顺序的,
2024-04-11 00:39:44
398
原创 AcWing 1027. 方格取数
如果使用了先走和后走的方式,这种方式利用了贪心的思想,会产生局部最优解,但局部最优解毕竟不是全局最优解。所以要采用同时走的方式。
2024-04-11 00:35:47
245
空空如也
背包01问题(Java)
2021-06-28
为什么front =rear时,栈内为空?希望有人可以帮我详细解答一下!!!
2021-06-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人