NLP研究:任务、基准与成果传播
1. IndicGLUE基准任务
IndicGLUE基准包含多种基于印度语言多语言多样性的任务,以下是部分任务介绍:
| 任务名称 | 任务描述 | 数据集情况 |
| — | — | — |
| 完形填空式问答任务 | 给定一个带有掩码标记的文本,目标是从四个候选术语中预测一个 | 涵盖11种语言的239k个实例 |
| 命名实体识别任务 | 句子带有B、I、O风格的标签,指示句子中对应单词的命名实体 | 涵盖11种印度语言的787k个句子 |
| 跨语言句子检索任务 | 给定一个句子作为输入,目标是从目标语言的一组句子中选择最可能的翻译 | 基于涵盖8种印度语言的39k个平行句子对的数据集 |
此外,IndicGLUE基准还包括推理、情感分析、话语分析和释义检测等任务,这些任务都体现了跨语言性。
graph LR
A[IndicGLUE基准任务] --> B[完形填空式问答任务]
A --> C[命名实体识别任务]
A --> D[跨语言句子检索任务]
A --> E[其他任务]
E --> E1[推理]
E --> E2[情感分析]
E --> E3[话语分析]
E --> E4[释义检测]
2. BIG - Bench基准
2.1 概述
BIG - Bench是一个用于评估NLP模型的不断发展的任务集合,用户贡献者可以向其存储库添加新的数据集,它是
超级会员免费看
订阅专栏 解锁全文

1130

被折叠的 条评论
为什么被折叠?



