图像分类中的图像增强技术
1. 几何变换过滤器
在图像增强领域,平移过滤器很少被使用。这是因为为单张图片找到安全的平移级别相对容易,但为整个数据集找到合适的平移级别却颇具挑战。
目前已知的几何变换过滤器有翻转、裁剪、填充、调整大小、旋转和平移等。然而,实际上还有许多其他的几何变换过滤器,例如扭曲、缩放、倾斜和拉伸等。虽然这些过滤器众多,难以一一涵盖,但它们的编码过程是相似的。
1.1 挑战
可以尝试实现另外两种几何变换技术,如扭曲和倾斜。提示:可以复制并粘贴已有的包装函数,然后修改 aug 和 item_tfms 变量。
2. 光度变换
2.1 选择Albumentations库的原因
选择Albumentations库来实现光度变换,主要原因有两个:一是该库拥有超过70种过滤器;二是它可以集成到Fast.ai框架中。Fast.ai框架具备大部分基本的光度过滤器,如色调偏移、对比度和亮度调节等,但只有Albumentations库拥有一些更独特的过滤器,如添加雨景、运动模糊和FancyPCA等。
在使用这些独特的过滤器时要格外小心。尽管它们易于实现,但应该参考相关的学术论文,以确定这些过滤器是否有助于提高模型的准确率。
2.2 编码过程
与几何变换的编码过程类似,首先创建基础方法,然后为每个光度变换编写包装函数。 _draw_image_album() 方法用于从数据中选择一组图像样本,将其转换为NumPy数组,进行变换,并以批量模式显示
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



