- 博客(3)
- 收藏
- 关注
原创 机器翻译实验
机器翻译是指将一段文本从一种语言自动翻译到另一种语言。因为一段文本序列在不同语言中的长度不一定相同,所以我们使用机器翻译为例来介绍编码器—解码器和注意力机制的应用。
2024-06-27 11:57:58
1356
原创 基于Transformer实现机器翻译(日译中)
然而,为了学习目的,通常建议对数据进行抽样,确保一切按预期工作,然后再使用全部数据,以节省时间。在这里,我将BATCH_SIZE设置为16,以防止“cuda内存不足”,但这取决于各种因素,如机器内存容量、数据大小等,所以可以根据您的需要随意更改批量大小(注意:PyTorch的教程使用Multi30k德语-英语数据集将批量大小设置为128。首先,我们创建翻译新句子的功能,包括获取日语句子、标记化、转换为张量、推理,然后将结果解码回句子等步骤,但这次是用英语。位置编码被添加到标记嵌入中,以引入单词顺序的概念。
2024-06-27 11:21:35
1831
原创 使用前馈神经网络进行姓氏分类
感知器是一种简单的神经网络,但其主要缺点是无法有效地学习复杂的数据模式。相比之下,卷积神经网络(CNN)通过窗口滤波器的启发,在处理数字信号时能够有效地学习局部化模式。这使得CNN不仅在计算机视觉中非常成功,还能在处理序列数据(如单词和句子)中检测子结构。与多层感知器一起,它们构成了前馈神经网络的一部分,而递归神经网络(RNNs)则通过循环允许信息反馈,这将在后续实验中介绍。在这本节中,我们将介绍在PyTorch中实现多层感知器(MLP)。
2024-06-27 10:43:50
1426
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人