33、神经网络机器翻译模型评估与拓展

arduino9maker

于 2025-11-19 11:16:55 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习玩转自然语言文章标签：神经网络机器翻译 BLEU评分数据清洗

本文链接：https://blog.youkuaiyun.com/arduino9maker/article/details/155017743

深度学习玩转自然语言专栏收录该内容

33 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络机器翻译模型评估与拓展

1. 评估神经网络翻译模型

我们将在训练集和测试集上对模型进行评估。理想情况下，模型应在训练集上表现出色，并能泛化到测试集上。最好使用单独的验证集来辅助训练过程中的模型选择，不过这里我们暂用测试集。

首先，需要加载并准备干净的数据集，以下是代码示例：

# load datasets
dataset = load_clean_sentences('english-german-both.pkl')
train = load_clean_sentences('english-german-train.pkl')
test = load_clean_sentences('english-german-test.pkl')
# prepare english tokenizer
eng_tokenizer = create_tokenizer(dataset[:, 0])
eng_vocab_size = len(eng_tokenizer.word_index) + 1
eng_length = max_length(dataset[:, 0])
# prepare german tokenizer
ger_tokenizer = create_tokenizer(dataset[:, 1])
ger_vocab_size = len(ger_tokenizer.word_index) + 1
ger_length = max_length(dataset[:, 1])
# prepare data
trainX = encode_sequences(ger_tokenizer, ger_le

会员秒杀 ¥9.9 重磅福利

超级会员免费看