自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基于Transformer实现机器翻译

目录1. 引言 1.1 实验简介 1.2 实验环境 1.3 数据集和分词器下载链接 2. Transformer模型的主要架构 3. 实验步骤 3.1 导入相关库 3.2 获取并行数据集 3.3 准备分词器 3.5 创建要在训练期间迭代的DataLoader对象 3.6 Transformer模型的实现 3.7 训练 3.8 尝试使用训练后的模型翻译日文 3.9 保存Vocab对象和训练的模型 1. 引言1.1 实验简介在现

2024-06-27 20:31:26 1169

原创 机器翻译-

所以,它可能会将英文的"cat"直接翻译成法文的"chat"。而一个基于统计的模型可能会考虑语料库中的短语和句子的出现频率,来判断"cat"在某个上下文中是否应该翻译成"chat"。示例: 如果机器输出是 “the pet is on the rug”,而参考翻译是 “the cat is on the mat”,尽管有些词不完全匹配,但METEOR会认为"pet"和"cat"、"rug"和"mat"之间有某种相似性。而如果上下文中提到了"river",则"bank"应该被翻译为"河岸"。

2024-06-27 20:30:08 1550

原创 自然语言处理(nlp)前馈网络

在多类设置中,将在本实验后面的“示例:带有多层感知器的姓氏分类”一节中看到,输出向量是类数量的大小。使用两个线性层之间的非线性是必要的,因为没有它,两个线性层在数学上等价于一个线性层4,因此不能建模复杂的模式。首先,感知器的实现包括数据集的加载与预处理、向量化器和DataLoader的定义、模型的构建和训练循环的实现。实验结果表明,感知器只能处理线性可分问题,具有局限性,而MLP通过增加隐藏层和非线性激活函数,能够处理更复杂的非线性可分问题,分类准确率显著提高。错误的分类用块填充,正确的分类没有填充。

2024-06-27 20:28:00 1744

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除