Task 03:
-
欠拟合现象:模型无法达到一个较低的误差
-
过拟合现象:训练误差较低但是泛化误差依然较高,二者相差较大
Task 04:
- 机器翻译和数据集
机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。
-
注意力机制
注意力层显式地选择相关的信息。
注意层的内存由键-值对组成,因此它的输出接近于键类似于查询的值。
Task 05:
卷积神经网络基础
介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。
二维卷积层
介绍的是最常见的二维卷积层,常用于处理图像数据。
本文探讨了机器翻译(MT)的基本概念,特别是神经机器翻译(NMT),并介绍了其主要特征,如输出单词序列而非单个单词,以及序列长度的变化性。此外,还讨论了注意力机制如何帮助神经网络在翻译过程中关注相关信息。
59

被折叠的 条评论
为什么被折叠?



