数据标注的类别有哪些

本文详细介绍了数据标注的三大类别:图像类包括矩形拉框、多边形拉框、点划线、OCR识别和语义切分;语音类涉及注音和其他类型语音标注;文本类则涵盖情感标注、实体标注和相似性判断。通过对各类别数据标注的深入理解,有助于提升AI模型的训练效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在我之前的文章中,我已经介绍了什么是人工智能下的数据标注,并简单介绍了数据标注的种类和应用。现在我将详细介绍数据标注的类型,以便大家对数据标注有更深入的了解。
一、形象类
矩形拉框:这属于数据标注中的2D拉框,通常需要拉一个矩形框来配合框架选择要检测的对象(人、动物、汽车等)。).从框中选择要检测的对象后,应在所选框中添加一个或多个标签来指示该对象。如果是人,可能需要注明性别、年龄、衣着等。
多边形拉框:多边形拉框类似于矩形拉框,但多边形拉框要求较高,需要围绕标记元素的轮廓进行标记,多为点框形式。由多边形绘制的框通常需要标记以指示元素。
点划线:点划线需要根据要求在面上或关键部位进行,往往会对每个点的位置进行限制和要求,从而实现高精度的检测和识别。这种贴标对人员要求比较高,但是对应的贴标单价会高很多。
OCR识别:OCR识别分为两部分:一部分是拉框,选择要检测的部分。这部分类似于上面的多边形拉框,另一部分需要高精度的传递选中部分的内容。这种标记数据常用于文本检测模型的训练。
语义切分:这种标注相对于拉盒占的比例较小,但目前有增加的趋势。这种标注需要区分图片中的元素,并分别标注和填充各个部分。一般要告诉ps抠图,先把这部分元素抠出来,再选择属性标签,这样这部分元素就可以抠出来了。
图片评论的分类:这种标注需要根据需求判断图片。有些图片需要分类,有些在判断图片内容时符合要求,有些在判断两张或几张时属于同一类。
下面分享一篇文章,详细介绍了常用于图像标注的工具和平台。有兴趣可以看看。
https://blog.51cto.com/14028810/2307977
第二,语音类
注音:注音是最常见的注音之一,播音员需要听一段语音,然后将听到的语音进行转录。按语言可分为汉语、外语、方言。根据时间长短,可分为分段语音和长语音。一般少于一分钟(通常三秒左右)的语音为短语音,其中语音的长度、音质、预标结果、切音等因素都会极大地影响语音转录的难度。
其他类型的语音标注:其他类型的语音标注所占比例相对较小,比如对于一段文字和语音来说,判断文字和语音内容是否对应,或者对于一个语音标注者来说,识别语音是否包含非法敏感元素。
下面分享一篇文章,详细介绍语音数据标注涉及的工具和数据标注

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值