Redis-bench 使用与启动教程

温姬尤Lee

于 2025-04-12 10:00:26 发布

阅读量795

点赞数 18

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00711/article/details/147160373

Redis-bench 使用与启动教程

redis-bench 项目地址: https://gitcode.com/gh_mirrors/re/redis-bench

1. 项目介绍

Redis-bench 是一个用于评估和增强大型语言模型在罕见病问答中的性能的开源项目。该项目是论文《Assessing and Enhancing Large Language Models in Rare Disease Question-answering》的官方代码库。它涵盖了广泛的罕见病类型，并提供了相应的数据集和工具，以帮助研究者评估和改进大型语言模型在处理罕见病相关问题上的表现。

2. 项目快速启动

在开始使用 Redis-bench 之前，请确保您已经安装了以下环境和依赖：

Python 3.10.0 环境搭建
安装与 CUDA 版本兼容的 PyTorch 版本（例如 PyTorch 2.4.0+cu121）
安装所需的其他库：pip install -r requirements.txt
确保安装了 Git LFS，以便下载大型语料库
安装 Java，以使用 BM25 检索器

以下是快速启动项目的步骤：

# 加载 ReDis-QA 数据集
from datasets import load_dataset
eval_dataset = load_dataset("guan-wang/ReDis-QA")["test"]

# 加载 ReCOP 语料库
from datasets import load_dataset
corpus = load_dataset("guan-wang/ReCOP")["train"]

# 在 ReDis-QA 数据集上运行无 RAG 的 LLMs
bash zero-shot-bench/scripts/run_exp.sh

# 在 ReDis-QA 数据集上使用元数据检索器运行带有 ReCOP 语料库的 RAG
bash meta-data-bench/scripts/run_exp.sh

# 在 ReDis-QA 数据集上使用 MedCPT/BM25 检索器运行带有 ReCOP 和基线语料库的 RAG
bash rag-bench/scripts/run_exp.sh

# 在 ReDis-QA 数据集上运行带有基线语料库和 ReCOP 组合的 RAG
bash combine-corpora-bench/scripts/run_exp.sh