- 博客(5)
- 收藏
- 关注
原创 深度学习复试项目之文本分类
在自注意力机制中,文字(如单词或字符)需要被表示为数值化的向量形式,以便模型进行计算。位置编码(Positional Encoding)(在self-attention里)RNN 和 LSTM太慢了。只能一个一个来,不能一下子看完整篇文章, 输出结果。缩放因子根号d:防止点积过大导致softmax梯度消失。Softmax:沿行方向归一化为概率分布。词嵌入(Word Embedding)传统RNN在长序列处理中存在。[CLS]:分类任务输出位置。[MASK]:掩码占位符。[SEP]:句子分隔符。
2025-03-20 14:26:20
797
原创 深度学习复试项目之图像分类
对于分类问题的输出,可以通过One-hot(独热编码)的方式。回归任务的LOSS计算方法为 MSE 和 MAE,对于分类任务的LOSS,采用交叉熵损失来计算(CrossEntropy Loss)。此时我们需要给出的参数有预测的分布和真实值的下标。卷积层是全连接层的高效变体:通过引入局部连接和参数共享,卷积层在保持模型表达能力的同时显著减少参数量。1×1卷积是通道维度的全连接:常用于调整通道数或特征融合。
2025-03-19 14:58:27
579
1
原创 优快云周赛第39期题解
她发现商店一共有 3 种包装的铅笔,不同包装内的铅笔数 量有可能不同,价格也有可能不同。商店不允许将铅笔的包装拆开, 因此P老师可能需要购买超过 n 支铅笔才够给小朋 友们发礼物。现在P老师想知道,在商店每种包装的数量都足够的情况 下,要买够至少 n 支铅笔最少需要花费多少钱。题解:去除掉不可能被看到的(可以记录前缀最大值然后标记,也可以维护一个第一个元素开始的单调递增的序列),然后二分查找即可。已知n天后的股票行情,现在已有的本金是m, 规定只能入手一次股票和抛售一次股票。2、题目名称:近视的小张。
2023-03-24 23:03:40
296
原创 优快云周赛第37期题解
3、题目名称:大整数替换数位 以字符串的形式给你一个长度为 M 的整数 N,请你计算出对这个数进行一次操作后模 9 的值为 1 的所有可能的不同操作 方式。在一次操作中, 我们可以选择 N 的一个数位 N[i],并把它替换成另一个不同的 0 到 9 范围之内的数 B,当且仅当它们选 择的 i 或 B 不同时两种操作方式不同。4、题目名称:莫名其妙的键盘 有一个神奇的键盘,你可以用它输入a到z的字符,然而每当你输入一个元音字母(a,e,i,o,u其中之一)的时候,已输入的字 符串会发生一次反转!
2023-03-17 22:02:06
148
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人