前沿
前些日子,做了一个活虾检测的模型,一开始是用
roLabelImg进行标注的,奈何虾的个数太多,只用了部分数据。

如果是更小的虾苗,更密集,因此标注是一件很麻烦的事情。在使用了部分数据进行标注并训练之后,得到了用检测虾的模型,这个时候就可以利用训练好的模型在未进行标注的样本进行检查并进行批量标注了。
TXT到xml数据格式的转换
在用虾苗检测模型下进行批量样本检测的时候,生成的目标结果是四个点的坐标,但是不能确保漏检跟误检,所以还需要roLabelImg进行确认。因此需要转成roLabelImg对应的xml文件,roLabelImg对应的文件格式是中心点坐标和宽高,以及旋转角度。因此需要四个点转中心点+旋转角度的转换。
用检测器检测生成的txt格式如下:

每一行对应的是四点坐标x1,y1,x2,y2,x3,y3,x4,y4,class,difficulty
# *_* coding : UTF-8 *_*
# 功能描述 :把四点坐标x1,y1,x2,y2,x3,y3,x4,y4,class,difficulty转换成旋转框 cx,cy,w,h,angle换成
import os
import xml.etree.ElementTree as ET
import math
import cv2
import numpy as np
'''xml文件的格式'''
head ='''<annotation verified="no">
<folder>%(folder)s</folder>
<filename>%(name)s</filename>
<path>%(path)s</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>%(width)d</width>
<height>%(height)d</height>
<depth>%(depth)d</depth>
</size>
<segmented>0</segmented>
'''
source = ''' <object>
<type>robndbox</type>
<name>%(class)s</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<robndbox>
<cx>%(cx)0.4f</cx>
<cy>%(cy)0.4f</cy>
<w>%(w)0.4f</w>
<h>%(h)0.4f</h>
<angle>%(angle)0.6f</angle>
</robndbox>
</object>
'''
end = '''</annotation>
'''
def get_dataset_dirs(input_dir):
person_names = []
_subdirs = []
files = []
for person_name in os.listdir(input_dir):
person_names.append(person_name)
for person_name in person_names:
_subdir = os.path.join(input_dir, person_name)
if not os.path.isdir(_subdir):
continue
_subdirs.append(_subdir)
return _su

文章介绍了如何使用已训练的虾检测模型对大量样本进行自动标注,通过txt到xml的转换工具,利用opencv的cv2.minAreaRect函数计算中心点、宽高和旋转角度。尽管该方法存在角度计算的误差,需要人工校正,但能显著提高标注效率。
最低0.47元/天 解锁文章
3693

被折叠的 条评论
为什么被折叠?



