前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于tensorflow实现AI图片鉴黄(NSFW)

基于tensorflow实现AI图片鉴黄(NSFW)

作者头像
sparkexpert
发布于 2018-01-09 03:53:32
发布于 2018-01-09 03:53:32
7.2K12
代码可运行
举报
运行总次数:2
代码可运行

       yahoo开源了用于检测图片是否包含不适宜工作场所(NSFW)内容的深度神经网络项目https://github.com/yahoo/open_nsfw,GitHub 库中包含了网络的 Caffe 模型的代码。检测具有攻击性或成人内容的图像是研究人员进行了几十年的一个难题。随着计算机视觉技术和深度学习的发展,算法已经成熟,雅虎的这个模型能以更高的精度分辨色情图像。 由于 NSFW 界定其实是很主观的,有的人反感的东西可能其他人并不觉得如何。雅虎的这个深度神经网络只关注NSFW内容的一种类型,即色情图片。在网上看到了tensorflow实现的版本,进行了测试。

一、原理:来自(https://yahooeng.tumblr.com/post/151148689421/open-sourcing-a-deep-learning-solution-for)

从作者的一些技术文档中可以看出,其实质上是利用了CNN的一些图像分类模型来实现二分类问题(色情与否)。

Training a deep neural network for NSFW classification

We train the models using a dataset of positive (i.e. NSFW) images and negative (i.e. SFW – suitable/safe for work) images. We are not releasing the training images or other details due to the nature of the data, but instead we open source the output model which can be used for classification by a developer.

另外从下面这段话,可以看出。用了ResNet的方法来实现。

While training, the images were resized to 256x256 pixels, horizontally flipped for data augmentation, and randomly cropped to 224x224 pixels, and were then fed to the network. For training residual networks, we used scale augmentation as described in the ResNet paper [1], to avoid overfitting. We evaluated various architectures to experiment with tradeoffs of runtime vs accuracy.

  1. MS_CTC [4] – This architecture was proposed in Microsoft’s constrained time cost paper. It improves on top of AlexNet in terms of speed and accuracy maintaining a combination of convolutional and fully-connected layers.
  2. Squeezenet [3] – This architecture introduces the fire module which contain layers to squeeze and then expand the input data blob. This helps to save the number of parameters keeping the Imagenet accuracy as good as AlexNet, while the memory requirement is only 6MB.
  3. VGG [2] – This architecture has 13 conv layers and 3 FC layers.
  4. GoogLeNet [5] – GoogLeNet introduces inception modules and has 20 convolutional layer stages. It also uses hanging loss functions in intermediate layers to tackle the problem of diminishing gradients for deep networks.
  5. ResNet-50 [1] – ResNets use shortcut connections to solve the problem of diminishing gradients. We used the 50-layer residual network released by the authors.
  6. ResNet-50-thin – The model was generated using our pynetbuilder tool and replicates the Residual Network paper’s 50-layer network (with half number of filters in each layer). You can find more details on how the model was generated and trained here.

二、实验测试:

  将网上搜索的一些图片放到文件夹下,个性访问文件夹的方式来实现对文件夹下面的所有文件进行判断。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
print('加载测试图片...')
        for lists in os.listdir(args.input_file): 
            path = os.path.join(args.input_file, lists) 
            if os.path.splitext(path)[1] == '.jpg':
                print(path) 
                # 图片加载
                image = fn_load_image(path)
                # 检测
                predictions = \
                    sess.run(model.predictions,
                             feed_dict={model.input: image})
        
                print("'{}'图片的检测结果为:".format(path))
                print("\tSFW 得分:\t{}\n\tNSFW 得分:\t{}".format(*predictions[0]))

具体结果如下:

../data/3.jpg:比较奇怪的是,这张图片居然两个得分基本相当,可见其训练数据集主要是女性。

'../data/3.jpg'图片的检测结果为:

SFW 得分: 0.48673054575920105

NSFW 得分: 0.5132695436477661

../data/2.jpg(来自https://www.google.com.hk/%E8%89%B2%E6%83%85%E5%9B%BE%E7%89%87)

'../data/2.jpg'图片的检测结果为:

SFW 得分: 0.9827728271484375

NSFW 得分: 0.017227165400981903

../data/4.jpg:这张照片对艺术照片进行了处理,发现居然被判别为正常。

'../data/4.jpg'图片的检测结果为:

SFW 得分: 0.9892839789390564

NSFW 得分: 0.010715976357460022

../data/5.jpg(来自于http://upload.chinaz.com/2016/1110/6361438730342766349613345.jpeg)

'../data/5.jpg'图片的检测结果为:

SFW 得分: 0.15458464622497559

NSFW 得分: 0.8454152941703796

../data/1.jpg(https://www.google.com.hk/%E8%89%B2%E6%83%85%E5%9B%BE%E7%89%87)

'../data/1.jpg'图片的检测结果为:

SFW 得分: 0.15014633536338806

NSFW 得分: 0.8498536348342896

(注:所有图片均来自于互联网图片搜索,只用于实验用途。)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年08月26日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
求TensorFlow的鉴黄项目github地址
求TensorFlow的鉴黄项目github地址
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
利用人工智能检测色情图片
色情内容在中国一直处于严格的监管,即使这样,互联网上还是很容易就能访问到色情内容。还记得曾经的“绿坝-花季护航”软件么?由于其识别效果差、软件不稳定,最后不了了之,浪费了大量的人力和金钱。
云水木石
2019/07/02
3.3K1
利用人工智能检测色情图片
nsfw图片鉴黄神器
https://github.com/mdietrichstein/tensorflow-open_nsfw
R0A1NG
2022/02/19
4.5K0
nsfw图片鉴黄神器
人工智能“鉴黄师”
最近,雅虎利用分类神经网络搭建了一套可以辨别Not Suitable for Work(上班不宜,以下简称NSFW)色情图片的Caffe模型,并将源码搬上了github。点击原文进入Yahoo的git
顶级程序员
2018/04/26
2K0
人工智能“鉴黄师”
【机器学习看裸照】谷歌、微软、亚马逊,哪家图像API鉴黄能力强?
【新智元导读】如今,网络中每天会产生海量的图像文件,而对于这些图片进行安全性鉴定是非常有必要的。很多公司都会使用图像鉴定API对裸露或违法照片进行自动过滤和修改。本文便实现并比较了谷歌、微软、亚马逊等公司的鉴定API能力。
新智元
2018/08/16
2.1K0
【机器学习看裸照】谷歌、微软、亚马逊,哪家图像API鉴黄能力强?
AlexNet论文总结
本文介绍了深度卷积神经网络在图像分类任务上的挑战、解决方案和实验结果。首先,文章介绍了在自然语言描述场景下,针对图像分类任务的数据集和评估方法。然后,文章详细阐述了使用深度卷积神经网络在图像分类任务上的挑战,包括训练数据不充足、训练时间过长、模型过拟合等问题。接着,文章介绍了解决这些问题的方法,包括使用更大的数据集进行训练、使用更快的优化算法、使用正则化方法、数据增强、Dropout等。最后,文章给出了实验结果,展示了使用深度卷积神经网络在图像分类任务上的表现。
Tyan
2017/12/28
1.1K0
AlexNet论文总结
开源鉴黄AI新鲜出炉:代码+预训练模型,还附手把手入门教程
资源来自一名印度小哥Praneeth Bedapudi,涉及图像分类和目标检测两个科目。他在GitHub上最新发布了NudeNet项目,包含代码和两个预训练模型:负责识别露不露的图像分类模型和负责找出关键部位(以便打码)的目标检测模型。
量子位
2019/04/23
1.6K0
开源鉴黄AI新鲜出炉:代码+预训练模型,还附手把手入门教程
深夜,使用NSFW尝试一下图片鉴黄
前几天公司在讨论鉴黄的问题,对接了一些厂家提供的鉴黄服务。由于公司本身就是做音视频领域相关的,鉴黄的需求量较大。同时秉着「好好学习,天天向上」的精神。想自己试一下鉴黄相关的东西。刚好同事也提出了一个开源库。顺便的了解了一下。 当然本人纯粹是对于知识的渴求与好奇才尝试了一下,对于什么吉泽明步、小泽玛利亚、波多野结衣、饭岛爱、苍井空、武藤兰、麻生希...等等是绝对不认识的。都是为了学习...嗯~为了学习!
CainGao
2020/04/15
6.2K0
深夜,使用NSFW尝试一下图片鉴黄
Basic classification: Classify images of clothing
This guide trains a neural network model to classify images of clothing, like sneakers and shirts.
XianxinMao
2021/07/27
4110
【论文推荐】最新七篇目标检测相关论文—Self Paced、上下文注意力、特征反射、层次特征、Tiny SSD、少样本、协同学习
【导读】专知内容组整理了最近七篇目标检测(Object Detection)相关文章,为大家进行介绍,欢迎查看! 1. Self Paced Deep Learning for Weakly Supervised Object Detection(基于Self Paced深度学习的弱监督目标检测) ---- ---- 作者:Enver Sangineto,Moin Nabi,Dubravko Culibrk,Nicu Sebe 摘要:In a weakly-supervised scenario objec
WZEARW
2018/04/13
1.5K0
【论文推荐】最新七篇目标检测相关论文—Self Paced、上下文注意力、特征反射、层次特征、Tiny SSD、少样本、协同学习
NSFW 图片分类
NSFW指的是 不适宜工作场所("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。
deephub
2023/08/28
5000
NSFW 图片分类
《Understanding Deep Learning》书摘
豆瓣:https://book.douban.com/subject/36395283/
AlphaHinex
2025/01/19
830
《Understanding Deep Learning》书摘
Convolutional Neural Network (CNN)
我自己写的代码和该教程略有不一样,有三处改动,第一个地方是用归一化(均值为0,方差为1)代替数值缩放([0, 1]),代替的理由是能提升准确率
XianxinMao
2021/08/01
3070
Residual_Networks_v2a
Welcome to the second assignment of this week! You will learn how to build very deep convolutional networks, using Residual Networks (ResNets). In theory, very deep networks can represent very complex functions; but in practice, they are hard to train. Residual Networks, introduced by He et al., allow you to train much deeper networks than were previously practically feasible.
列夫托尔斯昊
2020/08/25
9930
Residual_Networks_v2a
深度学习与TensorFlow:FCN论文翻译(二)
Each layer of data in a convnet is a three-dimensional array of size h × w × d, where h and w are spatial dimensions, and d is the feature or channel dimension. The first layer is the image, with pixel size h × w, and d color channels. Locations in higher layers correspond to the locations in the image they are path-connected to, which are called their receptive fields.
云时之间
2018/06/23
1.1K0
深度学习与TensorFlow:FCN论文翻译(二)
YOLO,You Only Look Once论文翻译——中英文对照
You Only Look Once: Unified, Real-Time Object Detection Abstract We present YOLO, a new approach to
Tyan
2017/12/28
1.8K0
YOLO,You Only Look Once论文翻译——中英文对照
【全网首发】机器学习该如何应用到量化投资系列(二)
有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面和完整。从今日起,量化投资与机器学习公众
量化投资与机器学习微信公众号
2018/01/29
1.2K0
【全网首发】机器学习该如何应用到量化投资系列(二)
Single Shot MultiBox Detector论文翻译——中英文对照
SSD: Single Shot MultiBox Detector Abstract We present a method for detecting objects in images usin
Tyan
2017/12/28
1.2K0
Single Shot MultiBox Detector论文翻译——中英文对照
TensorFlow2.0 实战强化专栏(二):CIFAR-10项目
Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集了8000万个小尺寸图像数据集,CIFAR-10和CIFAR-100分别是这个数据集的一个子集(http://www.cs.toronto.edu/~kriz/cifar.html)。CIFAR-10数据集由10个类别共60000张彩色图片组成,其中每张图片的大小为32X32,每个类别分别6000张。
磐创AI
2020/03/04
1.1K0
Build Residual Networks
我们将使用残差网络建立一个很深的卷积神经网络,理论上而言越深的网络可以表示更加复杂的函数,但是训练也更加困难。Residual Networks可以让我们训练更深的网络。
小飞侠xp
2018/08/29
1.1K0
算法警告!该图片涉嫌违规不予显示
导读:一般看到这张图,“老司机”立马心领神会,就会猜到这篇文章的主题大致与什么相关。
IT阅读排行榜
2019/03/12
1.9K0
算法警告!该图片涉嫌违规不予显示
推荐阅读
相关推荐
利用人工智能检测色情图片
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验