NLP数据标注常用工具汇总

本文汇总了多个开源的数据标注工具,包括BRAT、prodigy、Chinese-Annotator、YEDDA、IEPY、Doccano、Deepdive和snorkel。这些工具支持不同类型的NLP任务,如实体识别、关系抽取和分类,有的还具备主动学习功能,适用于多种语言的标注工作。

一、开源数据标注工具

1. BRAT

  • 安装环境:osx或者linux系统,windows(linux虚拟环境)

  • 标注任务支持:实体识别、实体关系抽取、事件抽取标注

  • 标注语言支持:可适配到中文标注

  • 标注任务扩展:可适配到Aspect-Based Sentiment Analysis方向数据标注

  • 相关🔗:

2. prodigy

  • 标注任务支持:实体识别、分类、情感分析

  • 标注语言支持:只针对英文

  • 特点:基于主动学习的标注工具

3. Chinese-Annotator

  • 标注任务支持:中文命名实体识别、中文关系识别、中文文本分类

  • 安装环境:面向OSX

  • 特点:灵感来源Prodigy,基于主动学习的标注系统,同时支持用户标注

  • 相关🔗:

4. YEDDA

  • 标注任务支持:实体识别、实体关系抽取、事件抽取

  • 标注语言支持:支持大部分语言,包括英语、中文

  • 特点:基于python2、可标记种类数只有7种

  • 相关🔗:

5. IEPY

6. Doccano

7. Deepdive

8. snorkel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

syfly2014

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值