图像增强trick大集合

本文探讨了数据增强在图像处理中的各种方法,包括迈向终极数据集的概念,增强图像的元属性,以及如何通过游戏化和人机交互提升模型泛化能力。文章还提出增强标签和数据集的知识库思想,以及利用RL环境进行训练,同时讨论了不同类型的图像增强技术,如缩放、颜色转换和动态输入等,旨在提高AI模型的性能和人类视觉体验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

awesome augmention

这篇文章记录我想到的所有数据增强方法
如果有实现我会贴找到的相关

分类:输入是图像,任务是翻译
数据集永远是真实世界的子集
增强图像=工程泛化/实景兼容(一切图像算法)

以后我们可能会有一个数据集的sheet
上面写着就是这些特征统计信息,画成fig供取用什么的
能严格定义的东西,认知级别的,都是应该被统计的东西
而且这些统计信息,可以被用于数据增强
而且可以发现数据集缺陷,断层,断级

迈向终极:数据集是一个知识库

其实数据集应该是一个库/包,可以直接API调用
套用RL,数据集就是一个“环境”
只是现在这个环境还不太“智能”,不能高效反馈

多模态单本征输入
知识库可以包含图像模型,与人类设计增强同步优化,或使用预训练模型

每一张图像/图像型标注,有增强标签,可以采样
增强标签可以做叠加,也可以单独存在
这样增强方法就会绑定整个数据集,并且按照概率,数据集会增加千万倍

“连接”上这个RL环境,训练过程:目标知识将收集并“导入”模型
这个库还需要能做到,对模型的输出进行重组才能提交给损失(stage2

任务是一个游戏

早上看到cutmixresize的效果,,,

所以说
完全可以做一个游戏
一堆图像到处晃,然后让识别里面有啥,检测等等

屏幕(游戏)分辨率,就是CNN感知的那个面
然后游戏内容就是一堆图像乱飞,遮挡,colorshift都安排上
我就不信泛化能力不强了?

任务是一个人机(对抗/互动)游戏

重标注:
比如多人

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值