
Transformer学习与基础实验
文章平均质量分 96
以基本原理和模型结构图为主线对Transformer结构进行剖析,配合代码及其部分运行结果进行理解,以text to text的应用之一——文本翻译为例,进行Transformer实验的应用举例
Helloyouth2024
这个作者很懒,什么都没留下…
展开
-
Transformer学习与基础实验4——英汉翻译(2. 模型构建、训练、推理)
Transformer学习与基础实验系列文章的第4篇,基于自定义实现的Transformer模型的英汉翻译任务训练、推理等过程记录和代码理解,以及所有源码、模型结构图绘制文件的原件提供原创 2025-01-04 10:20:00 · 906 阅读 · 0 评论 -
Transformer学习与基础实验3——transformer应用举例演示——英汉翻译(1. 数据准备与处理)
中英文语料库分词、预处理多进程处理大型中文语料库的jieba分词算法以提高效率构造语料库词典创建训练数据集Dataset和Dataloader原创 2025-01-04 10:17:33 · 1200 阅读 · 0 评论 -
Transformer学习与基础实验2——Transformer结构
上一篇:Transformer学习与基础实验1——注意力机制。原创 2025-01-04 10:14:36 · 690 阅读 · 0 评论 -
Transformer学习与基础实验1——注意力机制
Transformer学习与基础实验系列文章的第1篇,加性注意力机制、点积注意力机制、自注意力和多头注意力机制的学习,从公式、结构图、代码结合理解原创 2025-01-04 10:10:17 · 1162 阅读 · 0 评论