自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 关于Transformer的一些常见问题的回答

允许模型同时关注不同子空间的信息,增强表达能力。单头无法捕捉多样化特征。

2025-03-26 09:44:06 503

原创 深度学习复试项目之文本分类

在自注意力机制中,文字(如单词或字符)需要被表示为数值化的向量形式,以便模型进行计算。位置编码(Positional Encoding)(在self-attention里)RNN 和 LSTM太慢了。只能一个一个来,不能一下子看完整篇文章, 输出结果。缩放因子根号d:防止点积过大导致softmax梯度消失。Softmax:沿行方向归一化为概率分布。词嵌入(Word Embedding)传统RNN在长序列处理中存在。[CLS]:分类任务输出位置。[MASK]:掩码占位符。[SEP]:句子分隔符。

2025-03-20 14:26:20 797

原创 深度学习复试项目之图像分类

对于分类问题的输出,可以通过One-hot(独热编码)的方式。回归任务的LOSS计算方法为 MSE 和 MAE,对于分类任务的LOSS,采用交叉熵损失来计算(CrossEntropy Loss)。此时我们需要给出的参数有预测的分布和真实值的下标。卷积层是全连接层的高效变体:通过引入局部连接和参数共享,卷积层在保持模型表达能力的同时显著减少参数量。1×1卷积是通道维度的全连接:常用于调整通道数或特征融合。

2025-03-19 14:58:27 579 1

原创 优快云周赛第39期题解

她发现商店一共有 3 种包装的铅笔,不同包装内的铅笔数 量有可能不同,价格也有可能不同。商店不允许将铅笔的包装拆开, 因此P老师可能需要购买超过 n 支铅笔才够给小朋 友们发礼物。现在P老师想知道,在商店每种包装的数量都足够的情况 下,要买够至少 n 支铅笔最少需要花费多少钱。题解:去除掉不可能被看到的(可以记录前缀最大值然后标记,也可以维护一个第一个元素开始的单调递增的序列),然后二分查找即可。已知n天后的股票行情,现在已有的本金是m, 规定只能入手一次股票和抛售一次股票。2、题目名称:近视的小张。

2023-03-24 23:03:40 296

原创 优快云周赛第37期题解

3、题目名称:大整数替换数位 以字符串的形式给你一个长度为 M 的整数 N,请你计算出对这个数进行一次操作后模 9 的值为 1 的所有可能的不同操作 方式。在一次操作中, 我们可以选择 N 的一个数位 N[i],并把它替换成另一个不同的 0 到 9 范围之内的数 B,当且仅当它们选 择的 i 或 B 不同时两种操作方式不同。4、题目名称:莫名其妙的键盘 有一个神奇的键盘,你可以用它输入a到z的字符,然而每当你输入一个元音字母(a,e,i,o,u其中之一)的时候,已输入的字 符串会发生一次反转!

2023-03-17 22:02:06 148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除