在深度学习任务中,数据质量直接影响模型性能。当训练数据不足或多样性欠缺时,图像增强技术(Image Augmentation)就像给数据集"打鸡血"一样,能显著提升模型的泛化能力!今天我们就结合TensorFlow的两种主流方法,带你玩转图像增强~
🎨 什么是图像增强?为什么需要它?
图像增强是指通过算法调整图像属性(亮度、对比度、裁剪、旋转等),提升图像质量或生成多样化训练数据的技术。它就像给图片加“滤镜”,但目标更明确:
-
提升模型鲁棒性:让模型适应光照变化、角度偏移等现实场景。
-
解决数据不足:用小数据集生成大量新样本,防止过拟合。
-
突出关键特征:比如边缘锐化让物体轮廓更清晰
🔧 方法一:tf.image —— 灵活的底层API
tf.image是TensorFlow的底层图像处理API,支持单张图片的精细化操作。以下常用方法速👇:
1、图像翻转和裁剪
import tensorflow as tf
import matplotlib.pyplot as plt
# 读取图片
image = tf.io.read_file('cat.jpg')
image = tf.image.decode_jpeg(image, channels=3)
# 1. 随机翻转(模拟镜子效果)功能是 以 50% 的概率对输入图像 cat 进行水平(左右)翻转。
flipped = tf.image.random_flip_left_right(image)
# 2.上下翻转,以50% 概率垂直翻转图像(上下颠倒)
vertical = tf.image.random_flip_up_down(image)
# 3. 随机旋转(±45度范围内)将图像随机旋转 90° 的倍数(90°、180° 或 270°)
rotated = tf.image.rot90(image, k=tf.random.uniform([], 1, 4, dtype=tf.int32))
# 4.随机裁剪
cropping = tf.image.random_crop(image,(200,200,3))
# 可视化对比
plt.figure(figsize=(15,3))# 调整画布大小
plt.subplot(151); plt.imshow(image/255); plt.title('Original')
plt.subplot(152); plt.imshow(flipped/255); plt.title('Flipped')
plt.subplot(153); plt.imshow(vertical/255)

最低0.47元/天 解锁文章
527

被折叠的 条评论
为什么被折叠?



