从2107年开始,人工智能在鉴黄领域的表现就已经得到验证,通过搭建一个常用的CNN模型,经过一定时期的训练我们就可以得到一个还不错的人工智能鉴黄模型。
网上有一些开源的鉴黄项目,比如yahoo NFSW,但是研究一番之后我们就会发现,其实用性并不强无法解决实际问题。所以我们需要建立自己的模型并训练他们。
1.收集样本
要想训练模型就需要大量的样本,而大量的样本收集往往占据了我们绝大部分的时间,如果你没有样本集的话,光收集处理样本这件事就需要占用一半以上的工作量。基于某些政策原因,如果你需要鉴黄样本集可以联系作者。
2.设计模型
需要设计一个CNN模型。这是最核心的技术,合理的设计一个CNN模型和调整参数是最核心的问题,这里推荐resnet。
3.训练模型
模型的训练也有很多技巧,比如SGD,权重更新保存,训练优化,训练可视化等。
4.泛化
泛化能力是最终的指标,训练好的模型在新样本的表现才是最终检验目标。





