山东大学2023-2024深度学习期末回忆及参考答案

最新推荐文章于 2024-08-05 17:10:10 发布

原创

最新推荐文章于 2024-08-05 17:10:10 发布 · 2.8k 阅读

·

49

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能

文章目录

考试并不难，就是背多分。只要你在平时的学习中认真复习，掌握好每一个知识点，考试时就能游刃有余。

名词解释（3*8=24分）

分布式表示

分布式表示（Distributed Representation）是一种表示方法，在这种方法中，信息是通过多个神经元的激活模式来表示的，而不是通过单个神经元的激活。它在自然语言处理和机器学习中广泛应用，特别是在词嵌入（word embeddings）中，每个词被表示为一个高维向量。

超参数

超参数（Hyperparameter）是指在机器学习模型训练之前设置的参数，这些参数的值不能通过训练数据直接学习到，而是需要通过实验或经验来确定。常见的超参数包括学习率、批量大小、网络层数等。

共现矩阵

共现矩阵（Co-occurrence Matrix）是一种矩阵，用于表示词语在一定窗口大小内的共现频率。在自然语言处理中，共现矩阵可以帮助捕捉词语之间的语义关系，是构建词嵌入的一种方法。

截断BPTT

截断BPTT（Truncated Backpropagation Through Time）是一种训练循环神经网络（RNN）的技术。由于RNN在处理长序列时会遇到梯度消失或爆炸的问题，截断BPTT通过限制反向传播的时间步数来缓解这些问题，从而提高训练效率和稳定性。

attention机制

Attention机制（Attention Mechanism）是一种在神经网络中用于提高模型性能的方法。它通过为输入序列中的每个元素分配不同的权重，使模型能够更好地关注重要的信息。Attention机制在机器翻译、图像描述生成等任务中取得了显著效果。

梯度确认

梯度确认（Gradient Checking）是一种验证反向传播算法正确性的方法。通过数值计算梯度并与反向传播计算的梯度进行比较，可以检查模型的梯度计算是否正确，从而确保模型的训练过程是可靠的。

疑惑度

疑惑度（Perplexity）是衡量语言模型性能的一种指标。它表示模型对测试数据的困惑程度，数值越低表示模型越好。具体来说，疑惑度是模型预测测试集上每个词的平均概率的倒数的指数。

还有一个忘了

名词解释基本不难，就是贝多芬

简答（6题）

1、说出训练数据测试数据验证数据的作用，为什么要分训练数据和测试数据？

训练数据、测试数据、验证数据的作用

训练数据：用于训练机器学习模型，通过不断调整模型参数，使模型能够从数据中学习到规律。
测试数据：用于评估模型的性能，测试数据是模型在训练过程中未见过的数据，能够反映模型的泛化能力。
验证数据：用于调参和选择模型，帮助确定最佳的超参数和模型结构，避免过拟合。

为什么要分训练数据和测试数据

分开训练数据和测试数据是为了评估模型的泛化能力。训练数据用于模型学习，而测试数据用于评估模型在未见过的数据上的表现。如果不分开，模型可能会过拟合训练数据，无法在实际应用中表现良好。

2、为什么激活函数要非线性函数？

1. 引入非线性特性

如果没有非线性激活函数，神经网络的每一层实际上只是对输入进行线性变换。多个线性变换的组合仍然是线性变换，这样的网络无法表示复杂的非线性关系。非线性激活函数使得神经网络能够学习和表示复杂的非线性模式，从而解决更复杂的问题。

2. 增加模型的表达能力

非线性激活函数使得神经网络能够近似任何函数（根据通用近似定理），从而大大增加了模型的表达能力。这样，神经网络可以更好地拟合训练数据，并在实际应用中

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。