ROME项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00012/article/details/139462854

ROME项目使用教程

rome Locating and editing factual associations in GPT (NeurIPS 2022) 项目地址: https://gitcode.com/gh_mirrors/rome4/rome

1. 项目介绍

ROME（Rank-One Model Editing）是一个用于在GPT模型中定位和编辑事实关联的开源项目。该项目由Kevin Meng等人开发，并在NeurIPS 2022上发表。ROME的主要目标是允许用户在自动回归的Transformer模型中进行事实编辑，从而在不改变模型整体结构的情况下，修改特定的事实关联。

ROME目前支持OpenAI的GPT-2 XL（1.5B参数）和EleutherAI的GPT-J（6B参数）。未来，ROME计划支持EleutherAI即将发布的20B参数的GPT-like模型。

2. 项目快速启动

安装依赖

ROME推荐使用conda来管理Python、CUDA和PyTorch相关的依赖，使用pip来管理其他依赖。首先，安装conda，然后运行以下命令：

/scripts/setup_conda.sh

运行示例

ROME提供了一些示例笔记本，展示了如何使用Causal Tracing和ROME进行模型编辑。以下是运行这些示例的步骤：

Causal Tracing：打开notebooks/causal_trace.ipynb，运行其中的代码，可以对任何语句进行因果追踪。
ROME：打开notebooks/rome.ipynb，运行其中的代码，可以进行ROME编辑。以下是一个简单的ROME编辑示例：
```
request = {
    "prompt": "[] plays the sport of",
    "subject": "LeBron James",
    "target_new": {
        "str": "football"
    }
}
```
这个示例将修改模型，使得在提到“LeBron James”时，模型会输出“football”而不是默认的“basketball”。