Transformer实现中英翻译项目

最新推荐文章于 2025-04-08 11:32:26 发布

dt3t

最新推荐文章于 2025-04-08 11:32:26 发布

阅读量549

点赞数

文章标签： transformer 深度学习人工智能

本文链接：https://blog.youkuaiyun.com/qq_36396406/article/details/132384993

版权

项目地址：https://github.com/dtTbt/Transformer-en-to-cn
B站视频：BV11p4y1J7YM

项目概述

这个项目涉及两个主要部分：data.py 和 transformer.py。其中data.py 包含数据处理模块。 transformer.py包含transformer模型，训练和预测模块。

文件结构

项目的文件结构如下：

data.py: 包含数据集下载和数据集读取的模块。
transformer.py: 包含Transformer模型的定义，以及训练和预测的模块。
data/: 存放数据集的文件夹。
README.md: 项目说明文档，你正在阅读的内容。

数据集

项目已经包含了所需的数据集，无需手动下载。数据集文件存放在data/文件夹中。

cn.txt.vocab.tsv与en.txt.vocab.tsv中每个词语后面的数字表示在训练文本中的出现次数。其中前几个特殊符号的含义如下：

<PAD>: 填充符号。
<UNK>: 未知符号。
<S>: 句子开始。
</S>: 句子结束。

cn.txt与en.txt中每行为一句话，一句话中任何两两相邻的词语和标点符号之间都使用空格分隔，以便于分词。

训练

要训练模型，请执行以下命令：

python transformer.py --cfg train

注意训练结束只会保存最终权重，而不是最优权重。

预测

要进行预测，请执行以下命令：

python transformer.py --cfg predict

此处提供一个可用的权重：百度网盘

注意训练与预测的具体参数设置都位于transformer.py中。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dt3t

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

《自然语言处理》第二次实验：机器翻译（Transformer中英文翻译实验）

MAVER1CK的博客

06-23

1556

加载原始数据，切分训练、测试数据，并预处理成模型输入所需的数据形式，并保存为mindrecord格式测试数据是否加载正常")")

Pytorch入门实战（5）：基于nn.Transformer实现机器翻译（英译汉）

最新发布

zru_9602的博客

04-08

1054

通过上述方法，你可以根据项目需求选择合适的途径来获取或生成vocab.txt文件。无论是从头开始创建，还是利用现有的资源，合理的选择和使用将有助于提升你的NLP项目的性能和效果。

基于Transformer的中英文翻译

m0_63642362的博客

12-05

4493

机器翻译的用途很广，比如政府国企在内容、新闻等上的多语言化，跨过公司协同业务开展，互联网软件百度翻译，金山词霸，同声传译，搜索引擎跨语言搜索，翻译机等等。

基于Transformer的翻译模型（英-＞中）

qq_44193969的博客

04-22

1万+

用transformer做翻译（英–>中） transformer结构具体原理可以参考这篇文章Transformer 数据格式因为我们的中文数据是繁体字，因此需将其转换为简体： import copy import math import matplotlib.pyplot as plt import numpy as np import os import seaborn as sns import time import torch import torch.nn as nn import

使用pytorch 的Transformer进行中英文翻译训练

金石软件

08-20

2630

在每个训练周期中，我们计算损失并进行反向传播和参数更新。请注意，在实际应用中，还需要根据任务需求进行更多的定制和调整。例如，加入位置编码、使用更复杂的编码器或解码器模型等。在训练过程中，我们使用交叉熵损失函数和Adam优化器进行模型训练。进行序列到序列（Sequence-to-Sequence）的机器翻译任务的示例代码，包括数据加载、模型搭建和训练过程。首先，我们加载数据并进行预处理，然后为源语言和目标语言建立词汇表。上述代码是一个基本的序列到序列机器翻译任务的示例，其中使用。

基于Transformer实现中英翻译任务的微调

WB231444的博客

07-27

2393

本文旨在说明如何通过Transfoemers库和pytorch来微调一个中英翻译模型。这里选择开源的opus-mt-zh-en模型来实现微调，提升该模型在特定语料上的性能。入门小白，如果有误还请指导。

基于Transformer实现机器翻译

A3609222003的博客

06-26

1674

机器翻译是指利用计算机技术和语言学知识来实现将一种自然语言的文本翻译成另一种自然语言的文本的过程。这种技术旨在使计算机能够理解和翻译人类语言，从而帮助人们跨越语言障碍进行沟通和交流。机器翻译系统通常依赖于大量的语料库和复杂的算法，其中包括统计机器翻译（SMT）和神经机器翻译（NMT）等不同的方法。近年来，随着深度学习技术的发展，神经机器翻译在NLP领域中变得越来越流行，因为它能够更好地捕捉句子结构和语义信息，从而提高翻译的准确性和流畅度。

基于transformer实现机器翻译(日译中)

qq_68080426的博客

06-25

897

接下来的几段代码和文本解释(用斜体写成)摘自最初的 PyTorch 教程[ https://PyTorch.org/tutorials/beginner/translation_transformer.html ]。除了 BATCH _ SIZE 和单词 de _ ocabwhich 被更改为 ja _ ocabb 之外，我没有做任何更改。Transformer是一个 Seq2Seq 模型介绍了“注意力是你所需要的一切”文件，以解决机器翻译任务。

PyTorch实现基于Transformer的神经机器翻译

07-01

**PyTorch实现基于Transformer的神经机器翻译** 神经机器翻译（Neural Machine Translation, NMT）是一种使用深度学习模型进行翻译的技术，它替代了传统的基于短语或词典的统计机器翻译方法。Transformer模型是NMT...

基于transformer实现机器翻译（日译中）

ai12581的博客

06-26

1415

在这篇博客中，我将分享一个使用 PyTorch 进行日语到英语翻译模型训练的项目。该项目旨在展示如何从数据处理到模型训练，再到模型保存和加载的完整流程。本项目使用 Transformer 模型，这是近年来在机器翻译任务中表现优异的一种深度学习模型。我们将使用从 JParaCrawl 下载的日英平行数据集。transformer由Encoder（编码器）和Decoder(解码器）组成，我们将实现transformer的完整流程走一遍。数据处理: 加载并预处理数据，包括分词和词汇表构建。模型构建。

基于Transformer的翻译模型

bullnfresh的专栏

08-04

980

Transformer 与 RNN 不同，可以比较好地并行训练。Transformer 中 Multi-Head Attention 中有多个 Self-Attention，可以捕获单词之间多种维度上的相关系数 attention score。由于 self-attention 没有循环结构，Transformer 需要一种方式来表示序列中元素的相对或绝对位置关系。Position Embedding (PE) 就是该文提出的方案。

深度学习实践（一）基于Transformer英译汉模型

qq_1033275663的博客

04-09

1326

数据集可以去网络上下载，下面的是train.txt文件部分内容，前面为英文，后面为繁体中文，中间以。作用：读取数据路径下的完整句子，并将其分割为一个一个的单词，并存到列表中返回。enumerate(可迭代元素)，返回的第一个值为索引，第二个值为元素。这里数据集是英文和繁体中文，所以第一步我们需要将繁体中文变为简体中文。将sentences里面每句话的每个单词组合形成一个新的列表。其他数据文件也相同。

transformer文本翻译代码

JLU_zhujjie的博客

12-13

1658

""" code by Tae Hwan Jung(Jeff Jung) @graykode, Derek Miller @dmmiller612, modify by shwei Reference: https://github.com/jadore801120/attention-is-all-you-need-pytorch https://github.com/JayParks/transformer """ # ===============================

Pytorch构建Transformer实现英文翻译

linxizi0622的博客

06-30

1487

Pytorch构建Transformer实现英文翻译

【NLP】从0搭建Transformer，实现英语--＞西班牙语的翻译

m0_63642362的博客

11-05

584

从0搭建Transformer 模型，并实现英语到西班牙语的机器翻译任务。

自然语言处理-基于Transformer实现机器翻译

2302_76165893的博客

06-26

861

原理：Transformer是一种基于注意力机制的深度学习模型，最初由Google在2017年提出。它在机器翻译任务中取得了很大成功，因为它能够在处理长距离依赖关系时表现优异，并且可以并行化处理。在机器翻译任务中，Transformer模型通常包括编码器和解码器两部分。编码器将源语言句子编码成一个上下文表示，解码器则根据这个上下文表示生成目标语言句子。

NLP模型（五）——Transformer模型实现（以一个小型文本翻译为例子）

ifhuke的博客

09-01

1739

Transformer的手动实现，从零开始，以一个文本翻译的数据集为例子

基于Keras-Transformer的中英文机器翻译实践教程

资源摘要信息:"基于Python开发的中英文机器翻译系统是利用Keras框架下的Transformer模型实现的，此系统专门提供了完整的源码以及使用文档，特别适合用作毕业设计、课程设计或是项目开发。本项目经过了严格的测试，...