43、NLP研究:任务、基准与成果传播

NLP研究:任务、基准与成果传播

1. IndicGLUE基准任务

IndicGLUE基准包含多种基于印度语言多语言多样性的任务,以下是部分任务介绍:
| 任务名称 | 任务描述 | 数据集情况 |
| — | — | — |
| 完形填空式问答任务 | 给定一个带有掩码标记的文本,目标是从四个候选术语中预测一个 | 涵盖11种语言的239k个实例 |
| 命名实体识别任务 | 句子带有B、I、O风格的标签,指示句子中对应单词的命名实体 | 涵盖11种印度语言的787k个句子 |
| 跨语言句子检索任务 | 给定一个句子作为输入,目标是从目标语言的一组句子中选择最可能的翻译 | 基于涵盖8种印度语言的39k个平行句子对的数据集 |

此外,IndicGLUE基准还包括推理、情感分析、话语分析和释义检测等任务,这些任务都体现了跨语言性。

graph LR
    A[IndicGLUE基准任务] --> B[完形填空式问答任务]
    A --> C[命名实体识别任务]
    A --> D[跨语言句子检索任务]
    A --> E[其他任务]
    E --> E1[推理]
    E --> E2[情感分析]
    E --> E3[话语分析]
    E --> E4[释义检测]

2. BIG - Bench基准

2.1 概述

BIG - Bench是一个用于评估NLP模型的不断发展的任务集合,用户贡献者可以向其存储库添加新的数据集,它是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值