Tensorflow2.0 YOLO篇之图像信息预处理

本文详细介绍了如何使用TensorFlow 2.0实现YOLOv2目标检测算法,包括图像预处理、数据集构建、标签转换、图像增强及网络模型训练等关键步骤。文章通过代码实例展示了如何将图片路径和框选信息转化为YOLO网络可处理的格式,并进行了数据增强以提升模型泛化能力。

Tensorflow2.0 YOLO篇之提取图像信息预处理



在上一篇博文中,我们已经将图片的路径和boxex信息分别存储在imgs和boxes的变量当中,现在我们就把他们转化为YOLO网络可以用的形式,本文中还是使用过vscode支持的jupyter的分布执行。有一说一,这个功能是真的好用.这里的代码是接着上一篇的,等到整个功能完全完成了,我会在最后一篇中留下完整代码的下载链接

转化为张量类型

使用tf.data.Dataset.from_tensor_slices将数据加载为tensor张量的形式

def preprocess(img,img_boxes):
    # img :string path
    # img_boxes: [40,5]
    x = tf.io.read_file(img)
    x = tf.image.decode_png(x,channels=3)
    x =tf.image.convert_image_dtype(x,tf.float32)
    return x ,img_boxes

def get_dataset(img_dir,ann_dir,batchsz):
    # return tf dataset
    # [b] ,boxes [b,40,5]
    imgs,boxes = parse_annotation('data/train/image','data/train/annotation',obj_names)
    db = tf.data.Dataset.from_tensor_slices((imgs,boxes))
    db = db.shuffle(1000).map(preprocess).batch(batchsz).repeat()
    print('db Images',len(imgs))
    return db

可视化图片

我们将刚才记载好的信息可视化进行查看

# visual the db
from matplotlib import pyplot as plt
from matplotlib import patches

def db_visualize(db):
    # imgs: [b,512,512,3]
    # imgs_boxes: [b,40,5]
    imgs,imgs_boxes = next(iter(db))
    img,img_boxes = imgs[0],imgs_boxes[0]
    f,ax1 = plt.subplots(1,figsize=(10,10))
    # display the image ,[512,512,3]
    ax1.imshow(img)
    for x1
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值