Tensorflow2.0 YOLO篇之图像信息预处理

最新推荐文章于 2025-09-10 12:26:37 发布

原创

最新推荐文章于 2025-09-10 12:26:37 发布 · 2k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #可视化 #网络 #深度学习 #python

本文详细介绍了如何使用TensorFlow 2.0实现YOLOv2目标检测算法，包括图像预处理、数据集构建、标签转换、图像增强及网络模型训练等关键步骤。文章通过代码实例展示了如何将图片路径和框选信息转化为YOLO网络可处理的格式，并进行了数据增强以提升模型泛化能力。

Tensorflow2.0 YOLO篇之提取图像信息预处理

在上一篇博文中，我们已经将图片的路径和boxex信息分别存储在imgs和boxes的变量当中，现在我们就把他们转化为YOLO网络可以用的形式，本文中还是使用过vscode支持的jupyter的分布执行。有一说一，这个功能是真的好用.这里的代码是接着上一篇的，等到整个功能完全完成了，我会在最后一篇中留下完整代码的下载链接

转化为张量类型

使用tf.data.Dataset.from_tensor_slices将数据加载为tensor张量的形式

def preprocess(img,img_boxes):
    # img :string path
    # img_boxes: [40,5]
    x = tf.io.read_file(img)
    x = tf.image.decode_png(x,channels=3)
    x =tf.image.convert_image_dtype(x,tf.float32)
    return x ,img_boxes

def get_dataset(img_dir,ann_dir,batchsz):
    # return tf dataset
    # [b] ,boxes [b,40,5]
    imgs,boxes = parse_annotation('data/train/image','data/train/annotation',obj_names)
    db = tf.data.Dataset.from_tensor_slices((imgs,boxes))
    db = db.shuffle(1000).map(preprocess).batch(batchsz).repeat()
    print('db Images',len(imgs))
    return db

可视化图片

我们将刚才记载好的信息可视化进行查看

# visual the db
from matplotlib import pyplot as plt
from matplotlib import patches

def db_visualize(db):
    # imgs: [b,512,512,3]
    # imgs_boxes: [b,40,5]
    imgs,imgs_boxes = next(iter(db))
    img,img_boxes = imgs[0],imgs_boxes[0]
    f,ax1 = plt.subplots(1,figsize=(10,10))
    # display the image ,[512,512,3]
    ax1.imshow(img)
    for x1

最低0.47元/天解锁文章