Tensorflow2.0 YOLO篇之提取图像信息预处理
在上一篇博文中,我们已经将图片的路径和boxex信息分别存储在imgs和boxes的变量当中,现在我们就把他们转化为YOLO网络可以用的形式,本文中还是使用过vscode支持的jupyter的分布执行。有一说一,这个功能是真的好用.这里的代码是接着上一篇的,等到整个功能完全完成了,我会在最后一篇中留下完整代码的下载链接
转化为张量类型
使用tf.data.Dataset.from_tensor_slices将数据加载为tensor张量的形式
def preprocess(img,img_boxes):
# img :string path
# img_boxes: [40,5]
x = tf.io.read_file(img)
x = tf.image.decode_png(x,channels=3)
x =tf.image.convert_image_dtype(x,tf.float32)
return x ,img_boxes
def get_dataset(img_dir,ann_dir,batchsz):
# return tf dataset
# [b] ,boxes [b,40,5]
imgs,boxes = parse_annotation('data/train/image','data/train/annotation',obj_names)
db = tf.data.Dataset.from_tensor_slices((imgs,boxes))
db = db.shuffle(1000).map(preprocess).batch(batchsz).repeat()
print('db Images',len(imgs))
return db
可视化图片
我们将刚才记载好的信息可视化进行查看
# visual the db
from matplotlib import pyplot as plt
from matplotlib import patches
def db_visualize(db):
# imgs: [b,512,512,3]
# imgs_boxes: [b,40,5]
imgs,imgs_boxes = next(iter(db))
img,img_boxes = imgs[0],imgs_boxes[0]
f,ax1 = plt.subplots(1,figsize=(10,10))
# display the image ,[512,512,3]
ax1.imshow(img)
for x1

本文详细介绍了如何使用TensorFlow 2.0实现YOLOv2目标检测算法,包括图像预处理、数据集构建、标签转换、图像增强及网络模型训练等关键步骤。文章通过代码实例展示了如何将图片路径和框选信息转化为YOLO网络可处理的格式,并进行了数据增强以提升模型泛化能力。
最低0.47元/天 解锁文章

1156

被折叠的 条评论
为什么被折叠?



