随着互联网的发展,内容安全成为互联网不得不面临的严峻挑战。互动社区的崛起,网友素质的参差不齐,由于“涉黄”被勒令关闭的网站多如牛毛,因此“鉴黄”也显得尤为重要。虽然各个互联网企业都有专门的人员来做内容审核,但是无法跟上内容发展的速度,人工审核容易出现审核不及时、高成本、主观判断影响结果等问题。
因此通过深度学习的人工智能技术来进行图片鉴黄也是迫在眉睫。在本数据集一共包括5种图片类别,每个类别至少有1000张图像,其中训练集、验证集和测试集划分比例为6:2:2.
分析:赛题为图像5分类问题,初步选用resnet50 , vgg19 ,densenet 进行测试得分,使用预训练权重,改变softmax输出层的输出特征维度为5。
核心思路(解决方法的重点和亮点。包括但不限于数据预处理、数据增强、模型选择、模型优化、模型集成等)
进一步尝试后,采用了resnext网络,使用开源权重(from github)调参明细如下:
- 选用网络resnext101_32x16和pretrained weights :,引用pytorch相关库实现,
- 图像变换 : 0.5概率的水平翻转。
- 冻结网络层 : 前5层(此赛题效果最佳)。引用前人调参经验如下:场景:数据集小,数据相似度不高 在这种情况下,我们可以冻结预训练模型中的前k个层中的权重,然后重新训练后面的n-k个层,当然最后一层也需要根据相应的输出格式来进行修改。
- 因为数据的相似度不高,重新训练的过程就变得非常关键。而新数据集大小的不足,则是通过冻结预训练模型的前k层进行弥补。
- 图像size :2245. 衰减的学习率 : 余弦退火策略 - torch.optim.lr_scheduler.CosineAnnealingLR()
心得收获(竞赛收获,上分经验,比赛技巧)
- 就图像

针对互联网内容安全挑战,本文分享了一种基于深度学习的图片鉴黄解决方案,通过ResNeXt网络与预训练权重,结合数据增强及学习率策略,实现了高效准确的图像分类。
最低0.47元/天 解锁文章
6096

被折叠的 条评论
为什么被折叠?



