Datawhale AI 夏令营 NLP方向 Task2笔记-优快云博客

本文链接：https://blog.youkuaiyun.com/Meteora1024875/article/details/140502563

该笔记比较baseline2与1相比进行了哪些改进，以及对后续优化的启发。

赛题回顾

利用神经网络实现机器翻译，先编码再解码，将英文翻译为中文。

task2任务内容

如何更好地实现文本到编码的转换从而提升模型性能？

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.nn.utils import clip_grad_norm_
from torchtext.data.metrics import bleu_score
from torch.utils.data import Dataset, DataLoader
from torchtext.data.utils import get_tokenizer
from torchtext.vocab import build_vocab_from_iterator
from typing import List, Tuple
import jieba
import random
from torch.nn.utils.rnn import pad_sequence
import sacrebleu
import time
import math