awesome augmention
这篇文章记录我想到的所有数据增强方法
如果有实现我会贴找到的相关
分类:输入是图像,任务是翻译
数据集永远是真实世界的子集
增强图像=工程泛化/实景兼容(一切图像算法)
以后我们可能会有一个数据集的sheet
上面写着就是这些特征统计信息,画成fig供取用什么的
能严格定义的东西,认知级别的,都是应该被统计的东西
而且这些统计信息,可以被用于数据增强
而且可以发现数据集缺陷,断层,断级
迈向终极:数据集是一个知识库
其实数据集应该是一个库/包,可以直接API调用
套用RL,数据集就是一个“环境”
只是现在这个环境还不太“智能”,不能高效反馈
多模态单本征输入
知识库可以包含图像模型,与人类设计增强同步优化,或使用预训练模型
每一张图像/图像型标注,有增强标签,可以采样
增强标签可以做叠加,也可以单独存在
这样增强方法就会绑定整个数据集,并且按照概率,数据集会增加千万倍
“连接”上这个RL环境,训练过程:目标知识将收集并“导入”模型
这个库还需要能做到,对模型的输出进行重组才能提交给损失(stage2)
任务是一个游戏
早上看到cutmixresize的效果,,,
所以说
完全可以做一个游戏
一堆图像到处晃,然后让识别里面有啥,检测等等
屏幕(游戏)分辨率,就是CNN感知的那个面
然后游戏内容就是一堆图像乱飞,遮挡,colorshift都安排上
我就不信泛化能力不强了?
任务是一个人机(对抗/互动)游戏
重标注:
比如多人