一、开源数据标注工具
1. BRAT
-
安装环境:osx或者linux系统,windows(linux虚拟环境)
-
标注任务支持:实体识别、实体关系抽取、事件抽取标注
-
标注语言支持:可适配到中文标注
-
标注任务扩展:可适配到Aspect-Based Sentiment Analysis方向数据标注
-
相关🔗:
2. prodigy
-
标注任务支持:实体识别、分类、情感分析
-
标注语言支持:只针对英文
-
特点:基于主动学习的标注工具
3. Chinese-Annotator
-
标注任务支持:中文命名实体识别、中文关系识别、中文文本分类
-
安装环境:面向OSX
-
特点:灵感来源Prodigy,基于主动学习的标注系统,同时支持用户标注
-
相关🔗:
4. YEDDA
-
标注任务支持:实体识别、实体关系抽取、事件抽取
-
标注语言支持:支持大部分语言,包括英语、中文
-
特点:基于python2、可标记种类数只有7种
-
相关🔗:
5. IEPY
-
标注任务支持:主要是关系抽取
-
相关🔗:
6. Doccano
-
标注任务支持:实体识别、情感分类、机器翻译
-
标注语言:多语言
7. Deepdive
-
相关🔗:
8. snorkel
-
相关🔗:
本文汇总了多个开源的数据标注工具,包括BRAT、prodigy、Chinese-Annotator、YEDDA、IEPY、Doccano、Deepdive和snorkel。这些工具支持不同类型的NLP任务,如实体识别、关系抽取和分类,有的还具备主动学习功能,适用于多种语言的标注工作。
8805

被折叠的 条评论
为什么被折叠?



