10 行代码判定色*情*图片——Python 也可以系列之二
作者:赖勇浩(http://blog.youkuaiyun.com/lanphaday)
致编辑:我已经给图片打上马赛克了,别再删除了啊,我这是纯技术贴!
声明:本文因科学研究需要,包含部分色*情*图片,不可作为传播色*情*信息的证据。
今天先是在 优快云 看到《大学生发明依据皮肤比例过滤色*情*图片软件》(http://news.youkuaiyun.com/n/20081028/120298.html),后来发现这条新闻竟然已经上了网易新闻频道了(http://news.163.com/08/1028/05/4PAORMQB00011229.html),着实令人吃惊。
来自网易新闻的图片
根据作者的话说:“这个软件的原理在于通过计算面部、四肢图像区域,与整个肤色区域的面积比例和具体的分布,来判断网站中是否含有色*情*图片。”我估计他用的就是普通的肤色模型对图片的像素进行检测和统计,最多加上一些色块的分布、形状等数据进行一些条件过滤。于是我就写了段代码来分析图像,把图像中非肤色的像素去除,效果如下(声明:程序计算的数据是根据未打马赛克的图片计算的,因为保持 优快云 博客的需要,故打上马赛克再发表):
x