文章目录
考试并不难,就是背多分。只要你在平时的学习中认真复习,掌握好每一个知识点,考试时就能游刃有余。
名词解释(3*8=24分)
分布式表示
分布式表示(Distributed Representation)是一种表示方法,在这种方法中,信息是通过多个神经元的激活模式来表示的,而不是通过单个神经元的激活。它在自然语言处理和机器学习中广泛应用,特别是在词嵌入(word embeddings)中,每个词被表示为一个高维向量。
超参数
超参数(Hyperparameter)是指在机器学习模型训练之前设置的参数,这些参数的值不能通过训练数据直接学习到,而是需要通过实验或经验来确定。常见的超参数包括学习率、批量大小、网络层数等。
共现矩阵
共现矩阵(Co-occurrence Matrix)是一种矩阵,用于表示词语在一定窗口大小内的共现频率。在自然语言处理中,共现矩阵可以帮助捕捉词语之间的语义关系,是构建词嵌入的一种方法。
截断BPTT
截断BPTT(Truncated Backpropagation Through Time)是一种训练循环神经网络(RNN)的技术。由于RNN在处理长序列时会遇到梯度消失或爆炸的问题,截断BPTT通过限制反向传播的时间步数来缓解这些问题,从而提高训练效率和稳定性。
attention机制
Attention机制(Attention Mechanism)是一种在神经网络中用于提高模型性能的方法。它通过为输入序列中的每个元素分配不同的权重,使模型能够更好地关注重要的信息。Attention机制在机器翻译、图像描述生成等任务中取得了显著效果。
梯度确认
梯度确认(Gradient Checking)是一种验证反向传播算法正确性的方法。通过数值计算梯度并与反向传播计算的梯度进行比较,可以检查模型的梯度计算是否正确,从而确保模型的训练过程是可靠的。
疑惑度
疑惑度(Perplexity)是衡量语言模型性能的一种指标。它表示模型对测试数据的困惑程度,数值越低表示模型越好。具体来说,疑惑度是模型预测测试集上每个词的平均概率的倒数的指数。
还有一个忘了
名词解释基本不难,就是贝多芬
简答(6题)
1、说出训练数据测试数据验证数据的作用,为什么要分训练数据和测试数据?
训练数据、测试数据、验证数据的作用
- 训练数据:用于训练机器学习模型,通过不断调整模型参数,使模型能够从数据中学习到规律。
- 测试数据:用于评估模型的性能,测试数据是模型在训练过程中未见过的数据,能够反映模型的泛化能力。
- 验证数据:用于调参和选择模型,帮助确定最佳的超参数和模型结构,避免过拟合。
为什么要分训练数据和测试数据
分开训练数据和测试数据是为了评估模型的泛化能力。训练数据用于模型学习,而测试数据用于评估模型在未见过的数据上的表现。如果不分开,模型可能会过拟合训练数据,无法在实际应用中表现良好。
2、为什么激活函数要非线性函数?
1. 引入非线性特性
如果没有非线性激活函数