Open-NLLB 项目使用与启动指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00517/article/details/147035904

Open-NLLB 项目使用与启动指南

Open-NLLB Effort to open-source NLLB checkpoints. 项目地址: https://gitcode.com/gh_mirrors/op/Open-NLLB

1. 项目介绍

Open-NLLB 是一个致力于开放源代码的 NLLB（No Language Left Behind）模型的项目。NLLB 模型是一种强大的机器翻译系统，能够支持超过 200 种语言的相互翻译。Open-NLLB 的主要目标是发布真正开放源代码的 NLLB 检查点，这些检查点甚至可以用于商业目的。项目的扩展目标是扩展原有的 3.3B 参数密集型转换器（7B+）并支持非英语的语言模型。

2. 项目快速启动

以下步骤将帮助您快速启动 Open-NLLB 项目：

首先，确保您已经安装了必要的依赖。您可以从项目的 INSTALL 文件中找到详细的安装指南。

# 克隆项目仓库
git clone https://github.com/gordicaleksa/Open-NLLB.git

# 进入项目目录
cd Open-NLLB

# 安装依赖
pip install -r requirements.txt

接下来，您可以开始使用项目提供的脚本来准备数据集、训练模型或生成翻译。

例如，以下是使用预训练模型进行翻译的一个简单示例：

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

# 加载分词器
tokenizer = AutoTokenizer.from_pretrained("facebook/nllb-200-distilled-600M", use_auth_token=True)

# 加载模型
model = AutoModelForSeq2SeqLM.from_pretrained("facebook/nllb-200-distilled-600M", use_auth_token=True)

# 准备要翻译的文本
article = "这是一个需要翻译的句子。"

# 进行翻译
inputs = tokenizer(article, return_tensors="pt")
translated_tokens = model.generate(inputs, forced_bos_token_id=tokenizer.lang_code_to_id["目标语言代码"], max_length=30)

# 输出翻译结果
print(tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0])

请将 "目标语言代码" 替换为您想要翻译成的语言的 BCP-47 语言代码。