过气女星为何突上热搜?
绝世好男人为何掩面哭泣?
Rap新星为何一夜陨落?
数千万粉丝在网上疯狂宣泄究竟是为了什么?
熟悉的"周三见"重出江湖,
是否又会掀起腥风血雨?
这一切的背后,
究竟是人性的扭曲还是道德的沦丧?
让我们一起走进AI娱乐圈,一起用"人工智能"的技术,掀开一切神秘面纱,探索那些不为人知的秘密,追寻那无迹可寻的蛛丝马迹。
新年伊始,李小璐事件就霸占了所有人的网络流量,不管在哪儿都能看到相关新闻。本来我对这些花边新闻是没有任何兴趣的,但是,一次偶然的机会,我看到了下面这张图。
有很多网友说图片里的这只手不是李小璐的而是PGOne的,双方粉丝激烈争执,各抒己见,每个人似乎都有一些让对方信服的证据(你们真的没有关注到她脚上这双8W块钱的鞋子吗?和我同款耶!!)。甚至还有一些网友站在技术的角度上分析了一波,有人就用PS一个像素一个像素的对比。看到这儿我就坐不住了,咱完全可以搞一个模型出来啊,让"人工智能"判断这究竟是谁的手。
目的
我们的目的就是训练一个模型,这个模型要对李小璐和PGone的手特别熟悉,模型只要观看任何一个手就能给我们一个结论:这个手是李小璐的还是PGOne的,可以看出这就是一个图片二分类问题。简单的说,我们要输入下面这张图,然后让学习好的模型告诉我这只手是谁的。
模型架构
首先我们想一想,我们人类能不能看一只手就能知道这是谁的手呢?我个人觉得大部分人都做不到这一点,因为我们肉眼能看到的无非就是皮肤的颜色,大小等一些直观特征,而很多人手部的特征都是很相似的。但是机器就不一样了,他可以通过模型,对基本输入(像素)做这种变换和映射(卷积、池化),不仅可以看到关键点的明暗变化,还可以得到很多我们想象不到的特征。这其实就是计算机视觉中的卷积神经网络。
我们还是使用Python做开发语言,TF做深度学习库,直接用VGG19做迁移学习,这边我们要冷冻除output外的隐藏层,因为我们这个是一个二分类模型,而不是原模型的多分类。模型的整体结构看上下这两张图。
数据集
我是一个非常严谨的人,你让我直接写个爬虫去网上爬这种事情我是不想做的,因为很有可能带来脏数据,一个脏数据我也是不想要的。因此我决定,让实验室的人给我人肉截图,妹子去截李小璐的手,汉子去截PGOne的手,截不来两千张图你们都去给我挖煤去。最终,经过实验室小伙伴的不懈努力,终于凑够了不到一千张图……我现在在考虑春节前要不要让他们从煤窑出来。
训练
在调整过参数后,模型已经基本稳定了,下面就开始训练了。可以看到,一开始的准确率并不是特别高,然是随着不断的迭代和学习,经历了快30个Epoches后,测试集上的准确略已经达到了惊人的98%!!我的天呐!!!我怎么可以这么厉害。
验证结果
现在我们已经训练好了整个模型,接下来就是见证奇迹的时刻了,这只手到底是谁的呢?这背后究竟有没有阴谋呢?当当当当!
写在后面的话
我们近期打算上线一款AI娱乐媒体机器人,所有流程都由AI来负责。包含热点新闻追踪,定向人群分析,基于NLP的文章梗概,有感情的语音朗读等流程,敬请期待。
领取专属 10元无门槛券
私享最新 技术干货