CLARIN-PL和CLARIN-SI仓库集成:构建欧洲语言网格的关键步骤
1. 引言
欧洲语言网格(ELG)旨在成为一个统一的平台,促进欧洲语言技术的发展和应用。为了实现这一目标,ELG需要整合来自不同国家和地区的语言资源和技术。CLARIN-PL(波兰的CLARIN中心)和CLARIN-SI(斯洛文尼亚的CLARIN中心)是两个重要的国家级CLARIN中心,它们各自拥有丰富的语言资源和技术。将这些资源和技术集成到ELG中,对于丰富平台内容和支持多语言欧洲的语言技术生态系统至关重要。
2. CLARIN简介
CLARIN(Common Language Resources and Technology Infrastructure)是一个支持数字语言资源和工具共享、使用和可持续性的研究基础设施。它以网络联邦的形式建立,由语言数据存储库、服务中心和知识中心组成,所有参与国家的学术界成员都可以单点登录访问。CLARIN-PL和CLARIN-SI分别代表波兰和斯洛文尼亚的国家级CLARIN中心,它们在各自国家的语言技术领域发挥着重要作用。
2.1 CLARIN-PL
CLARIN-PL是波兰的CLARIN中心,致力于开发和维护波兰语的语言资源和技术。它包括以下主要组成部分:
- 语言资源 :包括语料库、词典、词汇