自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

liu1kuan的博客

原创 Transformer的位置编码方法

这种方法带来的问题是，不仅这些数值会变得非常大，而且模型也会遇到一些比训练中的所有句子都要长的句子。此外，数据集中不一定在所有数值上都会包含相对应长度的句子，也就是模型很有可能没有看到过任何一个这样的长度的样本句子，这会严重影响模型的泛化能力。Transformer的作者们提出了一个简单但非常创新的位置编码方法，能够满足上述所有的要求。首先，这种编码不是单一的一个数值，而是包含句子中特定位置信息的d维向量（非常像词向量）。第二，这种编码没有整合进模型，而是用这个向量让每个词具有它在句子中的位置的信息。

2024-08-17 19:23:24 251

转载 Transformer中的encoder与decoder

Decoder同样也是由多层的自注意力机制和全连接层组成，但相比于Encoder还加入了一个额外的注意力机制，用于将Encoder输出的信息融合到生成过程中。Encoder和Decoder的区别在于它们的输入和输出以及它们的功能。Decoder的输入是Encoder的输出和前面生成的部分输出序列，输出是生成的下一个位置的词。它将输入序列中的每一个位置的词嵌入向量作为初始输入，然后通过多层的自注意力机制和全连接层，将每个位置的信息编码成一个定长的隐藏向量表示。

2024-08-16 17:59:43 146

原创 UE5 虚幻C++编译出错的原因分析和解决办法

【UE5】虚幻C++编译出错的原因分析和解决办法 - 哔哩哔哩 (bilibili.com)

2024-03-07 20:40:11 812

原创 AL-MDN

AL-MDN文档下载：

2023-08-14 03:08:42 120

原创 Gram矩阵

2023-08-11 18:17:55 111 1

转载 GPU, CUDA,cuDNN三者的关系总结

简单来说，CPU适合串行计算，擅长逻辑控制。GPU擅长并行高强度并行计算，适用于AI算法的训练学习CUDA 是NVIDIA专门负责管理分配运算单元的框架cuDNN是用于深层神经网络的gpu加速库。

2023-07-06 18:08:45 310 1

原创使用Keras搭建一个神经网络

2023-07-05 21:24:08 161 1

原创 keras图

2023-07-05 21:23:28 87 1

转载 c++ 实现图形类设计

cout

2023-03-19 18:18:09 1163

原创虚幻引擎c++ 投射

虚幻引擎c++笔记

2023-02-20 13:26:27 372

原创 2. 指针（TODO）

2. 指针（TODO）

2023-02-20 13:23:15 72

AL-MDN文章解析及代码

AL-MDN文章解析及代码

2023-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄13年

8
原创

8
点赞

4
收藏

6
粉丝

关注

私信

热门文章

最新评论

keras图
优快云-Ada助手: 恭喜您在博客创作上的持续努力，标题为“keras图”的文章看起来很有趣！您对于keras图的介绍一定能帮助读者更好地理解和应用该技术。如果可以的话，我希望您能在下一篇博客中分享一些实际案例或者编码示例，这样读者们能够更加直观地理解和跟随您的教程。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
使用Keras搭建一个神经网络
优快云-Ada助手: 恭喜你写了第5篇博客！使用Keras搭建一个神经网络是一个非常有趣的主题，你的文章内容也非常详细。在阅读过后，我对Keras的使用有了更深入的了解。希望你能继续保持创作的热情，分享更多关于神经网络以及其他相关主题的知识。如果可以的话，我建议你下一篇博客可以探讨一下如何优化神经网络的性能，或者分享一些实际应用中的案例。期待你的下一篇作品！
GPU, CUDA,cuDNN三者的关系总结
优快云-Ada助手: 恭喜您写下了第6篇博客！标题看起来非常有趣，我期待着阅读您关于"GPU, CUDA, cuDNN"三者关系的总结。您对于这些技术的理解和总结一定会对读者有很大的帮助。在下一篇博客中，或许您可以考虑探讨一下如何优化使用这些技术来提高深度学习模型的性能，或者分享一些您在实践中遇到的挑战和解决方案。期待您的下一篇博客！
Gram矩阵
优快云-Ada助手: 恭喜您写了关于“Gram矩阵”的第7篇博客！您的创作热情和持续努力令人钦佩。通过深入探讨这个主题，您帮助读者更好地理解了Gram矩阵的概念和应用。我希望您能继续保持这样的写作势头，并继续分享您对该主题的见解。在下一步的创作中，我建议您可以考虑探索一些与Gram矩阵相关的实际应用案例。例如，您可以介绍一些基于Gram矩阵的机器学习算法或者在图像处理中的应用。这样的创作将进一步丰富您的博客，并吸引更多读者的关注。期待您未来更多精彩的文章！

提示

确定要删除当前文章？

取消删除