导读 | 如果你对网络上那些打上 NSFW(No Safe For Work,上班时间不要看)标签的照片是如何分类感兴趣的话,你应该会对这条新闻感兴趣,雅虎刚刚开源了他们自己构建的一套深度学习神经网络专门用于自动检测图片是否含有色情内容。 |
话虽简单,事实上用机器去分辨色情图片确实是件困难的事,毕竟在法理上区分淫秽都非常不容易,甚至可以说根本无法定义淫秽。美国前大法官波特·斯图尔特有一句名言:我看到它,才知道它是不是。机器是没有七情六欲的,任何图片在它看来都只是文件。
经过多年的研究和实践,卷积神经网络已经证明是最好的图片归类工具,只要提供相应的数据库,算法就可以学习这类图片的特性,比如分类狗狗的照片,只要识别尾巴鼻子头;分类汽车,前脸轮子门把手;给机器“欲望”,你们自己脑补吧。
雅虎的色情图片识别系统会给图片一个 NSFW 值,最无害的是 0,最极端是 1,题图里花从中的姑娘的 NSFW 值是 0.001,铁人三项妹子因为穿的稍微运动一些,数值升高到 0.116,也都不是色情图片的标准。
开源之后,这套识别系统可以在很多场合使用,除了第一时间能想到的审查系统,比如还可以用作自动 NSFW 标签器,帮你过滤工作邮箱里不合时宜的图片(来自其他员工的恶搞)。
各位如果有兴趣的话可以去雅虎的文章(https://yahooeng.tumblr.com/post/151148689421/open-sourcing-a-deep-learning-solution-for)里查看详细情况,模型可以在GitHub(https://github.com/yahoo/open_nsfw/blob/master/README.md)上下载,如果你想要搭建自己的色情图片识别系统,你必须自己提供数据,不过我想这应该不是什么问题。
(配图来自网络,非原文配图)
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/101457.html