Distinct-N 开源项目教程

最新推荐文章于 2025-05-22 17:41:05 发布

龙子旋

最新推荐文章于 2025-05-22 17:41:05 发布

阅读量297

点赞数 4

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00951/article/details/141837794

Distinct-N 开源项目教程

Distinct-NCompute Distinct-N metric proposed by Jiwei Li et al.项目地址:https://gitcode.com/gh_mirrors/di/Distinct-N

项目介绍

Distinct-N 是一个用于计算生成对话模型多样性的指标，由 Jiwei Li 等人提出。该指标通过计算句子中不同 n-gram 的数量来衡量句子的多样性，从而避免生成重复的单词。Distinct-N 指标不依赖于参考句子或真实数据，完全专注于生成句子的内在特性。

项目快速启动

安装

首先，克隆项目仓库到本地：

git clone https://github.com/neural-dialogue-metrics/Distinct-N.git
cd Distinct-N

安装所需的依赖：

pip install -r requirements.txt

使用示例

以下是一个简单的使用示例，计算生成句子的 Distinct-N 指标：

from distinct_n import Distinct_N

# 示例句子
sentences = [
    "我 说 这 是 怎 么 回 事 原 来 明 天 要 放 假 了",
    "我 说 这 是 啥 呢 我 说 这 是 啥 呢"
]

# 初始化 Distinct-N 类
distinct_n = Distinct_N()

# 计算 Distinct-1 指标
distinct_1 = distinct_n.calc_distinct_k(sentences, 1)
print(f"Distinct-1 指标: {distinct_1}")

# 计算 Distinct-2 指标
distinct_2 = distinct_n.calc_distinct_k(sentences, 2)
print(f"Distinct-2 指标: {distinct_2}")