首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >斯坦福研究人员让AI看了100部好莱坞大片,养出一个“吻戏识别大师”

斯坦福研究人员让AI看了100部好莱坞大片,养出一个“吻戏识别大师”

作者头像
CDA数据分析师
发布于 2019-07-11 09:49:08
发布于 2019-07-11 09:49:08
9120
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

来源:IEEE、Arxiv

编辑:大明

本文转自公众号:新智元

【导读】斯坦福大学研究人员给AI模型看了100部好莱坞电影,让AI看懂了什么是接吻,并从视频片段中分割识别出接吻的镜头场景,而且把接吻和性爱场景区分开来。嗯,想开车的朋友可能要等等,但想看吻戏的朋友这回可以一次看个够了。

和大多数没有接过吻的人一样,AI学接吻这件事最开始也是通过观看爱情电影片段进行的。AI通过看电影来了解关于接吻的基本知识,尤其是看看那些好莱坞明星的嘴唇动作究竟是什么样的。

研究人员对熟练掌握识别面部识别和目标识别的深度学习算法进行了训练,识别由专业演员戏剧化的热吻场景,这表明,AI系统已经能够更深入地了解最亲密的人类“交流”活动。

电影《泰坦尼克号》中男女主角著名的“船头接吻”镜头

这项研究来自Netflix的高级数据科学家Amir Ziai,他正在斯坦福大学攻读AI专业研究生。Ziai从过去一个世纪的好莱坞电影数据库中挑选了100部电影的代表性片段。然后手动将不同的电影片段标记为接吻/非接吻场景,并使用来自这些片段的静止图像帧和声音片段来训练深度学习算法,以检测影片中亲吻的场景和声音。

寻找非交叉接吻动作分割片段的算法伪代码

不过请不要误会,目前还不清楚这个测吻的方法是否可以用于亲吻之外的进一步性爱场景的识别。对此,Ziai 表示:“在我的训练数据集中有意远离了过度的性爱场景,以确保模型不会混淆接吻和性爱”。

Ziai目前的雇主Netflix没有参与斯坦福大学的这项研究,该研究一发表在预印本服务器arXiv上。Ziai尚未研究该技术在Netflix上的能否获得一些应用前景。但不难想象,这类视频识别技术可能会让Netflix或其他公司(如YouTube,Facebook,Instagram和TikTok)很感兴趣,由此技术开发出的商业应用可以处理大量流媒体或存储视频。

2019年4月,谷歌宣布其Pixel智能手机已经能够接收Photobooth功能更新,可以在智能手机摄像头拍摄的视频中检测到接吻时进行自动拍照。Ziai展示了与视频有关的接吻检测技术,未来的应用可以对视频内容进行自动分类,为用户打造个性化的视频推荐列表,甚至可能充当在线视频审核的部分作用,对某些内容的视频进行筛选。

“这是一个很好的例子,说明现代计算机视觉技术如何能够相当容易地开发特定的'感知和响应'软件,提示定性/非结构化的东西(如场景中的接吻),”OpenAI策略与转播主管杰克·克拉克说,他的导入人工智能新闻通讯,最近突出了亲吻检测研究。“我认为这是AI改变个人软件开发方面,未来受关注潜力最高的领域之一。”

目前对亲吻场景识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,已经基于ImageNet数据库中的超过一百万张图像进行了预训练。为了能够正确识别接吻的声音,使用名为VGGish的深度学习模型,利用每个接吻场景的一秒钟片段的后960毫秒的音频进行了训练。

使用这种双管齐下的训练方式,AI模型处理接吻的图像和音频的方式,让整个模型获得了高达的0.95的F1分数 - 这一分数用于衡量算法(对于误报和假阴性的)精度的加权平均值。

但是,面对一些电影场景中视频编辑过多,以及和摄像机角度问题时,模型可能会无能为力。拍摄演员接吻的远景镜头有时会骗过算法,因为这种情况下,大部分相机镜框内都是风景背景。快节奏的视频剪辑和不包括两个演员的镜头也证明是具有挑战性的。

要弄清究竟是AI模型究竟是根据哪些特定数据模式进行预测是比较困难的事情。人类尝试理解AI逻辑的一种方法是使用显着性图来突出显示在分析过程中受到AI最多关注的数据。在好莱坞电影中的亲吻场景中,深度学习模型似乎更加关注与演员面部相关的图像像素。

Ziai说,一些“有限的实验”也表明,AI模型更依赖视觉特征,而不是音频特征来识别接吻场景。实验表明,利用更加“精心调整的数据集”会更有利于接吻探测系统的性能发挥,并且可能利用更多的背景信息,而不仅仅是靠静止图像来识别接吻场景。

帕特里克·斯维泽和黛米·摩尔在1990年的电影《幽灵》中的接吻画面,该影片是数据科学家用于训练AI模型识别接吻场景选取的100部电影之一

目前还不清楚AI模型在全部100部好莱坞电影中的识别表现如何,如《安娜·卡列尼娜》(1935),《幽灵》(1990)和《皇家赌场》(2006)将在更大的电影数据集中发挥作用。但是,在训练数据集超过80个视频后,该模型仅仅出现了“边际化的性能提升”,Ziai说。好莱坞电影数据集和一些计算资源由斯坦福大学计算机科学助理教授Kayvon Fatahalian实验室提供。

另一个问题是,这种接吻AI识别模型是否能够在检测社交媒体上常见的视频中的接吻场景时表现出相当的精度。这一挑战可能需要对更大的视频数据集进行额外的训练。尽管如此,一些初步测试仍然表明,这种方式有望诞生更广泛的AI接吻检测应用。

“这项研究的尝试是使用多样化的数据集,让模型不会过度适应任何特定类型的电影,”Ziai说。“有趣的是,它似乎在我发现的一些YouTube视频上的性能表现相当不错。”

参考链接:

IEEE:

https://spectrum.ieee.org/tech-talk/robotics/artificial-intelligence/ai-learns-how-to-pucker-up-from-hollywood

论文链接:

https://arxiv.org/pdf/1906.01843.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何光明正大地学习KISS?当然是用这个DL接吻检测器了
不要误会。作为一个严肃的公众号,我们才不会收集什么奇怪的视频呢!我们批判了大量电影,造访了众多 GitHub,这次推荐给大家的内容的确包含大量视频数据,这些视频的确有那么点少儿不宜,大家看完还可以借鉴一下里面的姿势呢。
机器之心
2019/06/20
6290
如何光明正大地学习KISS?当然是用这个DL接吻检测器了
来自亚马逊、NEC 和斯坦福的 AI 研究人员推出了第一个深度视频文本替换方法“STRIVE”
来自 NEC 实验室、帕洛阿尔托研究中心、亚马逊、PARC 和斯坦福大学的一组研究人员正在共同努力解决在视频中真实地改变场景文本的问题。在这项研究背后的主要应用是为营销和促销目的创建个性化内容。例如,用个性化的名称或消息替换商店标志上的一个词,如下图所示。
代码医生工作室
2021/09/29
6050
来自亚马逊、NEC 和斯坦福的 AI 研究人员推出了第一个深度视频文本替换方法“STRIVE”
从复活巨星到修复老电影,细数AI在电影领域的打开方式
一面被称为最无耻的造假术,让神奇女侠”盖尔加朵被推倒在床,一番搔首弄姿后,上演各种辣眼睛的场面。
AI科技评论
2020/05/14
9270
从复活巨星到修复老电影,细数AI在电影领域的打开方式
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
Hedra的目标是建立一个人人都可访问的多模式创作工作室,因此将音频、图像、视频都结合在了一起。
量子位
2024/06/21
3070
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
斯坦福医疗ImageNet发布,如何评价PB级医疗影像数据集?
【新智元导读】斯坦福大学医学院与 Langlotzlab 合作创建的一个 PB 级的大型医疗影像数据集 Medical ImageNet 最近发布,从官方网页的介绍中可以看到,该数据集包含近万张临床X光片,以及超过440万斯坦福的检测即将公开。如此大规模的医疗数据集有望解决医疗影像数据不足问题,助推利用机器学习分析医学图像方面的进步。 Medical ImageNet 这是一个PB级规模的,基于云,多机构,可搜索,开放的诊断影像研究库,目的是开发智能影像分析系统。 主要目标 数据转移/联合/诚实中介者(ho
新智元
2018/03/28
1.5K0
斯坦福医疗ImageNet发布,如何评价PB级医疗影像数据集?
学界 | 斯坦福最新:用GAN补全镜头外的世界
被誉为最有想象力生成对抗网络GAN一出现就被Yann Lecun誉为“十年来机器学习领域最有趣的想法”,在图像领域更是催生了一批有趣的研究。
大数据文摘
2018/07/31
3090
学界 | 斯坦福最新:用GAN补全镜头外的世界
真假费德勒大战!斯坦福出品AI模型一键生成温网决赛
如果作为费德勒死忠粉对结局很不满的话 ,要不要试试这些用AI生成的网球比赛画面,既令人毛骨悚然又令人印象深刻。
新智元
2020/08/28
5450
真假费德勒大战!斯坦福出品AI模型一键生成温网决赛
找不出破绽!斯坦福等新研究:随意输入文本,改变视频人物对白,逼真到让作者害怕
让新垣结衣向你表白,让石原里美大声喊出你的名字,甚至随便根据某个人的视频伪造个人陈述……现在都不在话下。
量子位
2019/06/18
6500
找不出破绽!斯坦福等新研究:随意输入文本,改变视频人物对白,逼真到让作者害怕
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
在复杂的3D结构组装中,理解和执行说明书是一个多层次的挑战:从高层的任务规划,到中层的视觉对应,再到底层的动作执行,每一步都需要精确的空间理解能力。
新智元
2025/02/15
1520
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
斯坦福大学开发自主无人机摄影的算法,可显著提高电影中无人机镜头品质
人工智能(AI)算法、移动机器人和无人机(无人机)等新兴技术使得电影摄影如虎添翼。
大数据文摘
2021/05/27
4640
斯坦福大学开发自主无人机摄影的算法,可显著提高电影中无人机镜头品质
48小时封镜!这是一部完全由AI制作的科幻电影
新智元编译 来源:arstechnica 编译:肖琴 【新智元导读】在伦敦科幻电影节的“48小时电影挑战”,导演Oscar Sharp和AI研究员Ross Goodwin带来一部全部制作过程由AI
新智元
2018/06/22
8390
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
除了可以从任意位置开始,无限生成多样化且连贯的3D场景,WonderJourney根据文本描述生成时,可控性也很高。
量子位
2023/12/14
3040
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斑马识别成狗,AI犯错的原因被斯坦福找到了丨开源
Pine 发自 凹非寺 量子位 | 公众号 QbitAI 明明是只斑马,AI为什么说它是一条狗? 分类模型在归类图像时有时会错误地判断类别。 经过学习的AI,还会搞砸一些预测,肯定是在其中的某个环节出现了纰漏。 斯坦福大学的两位博士生和教授James Zou在一篇论文中,带我们探究了分类模型犯错的原因。 随后,论文提出一种方法——反事实的概念性解释(Conceptual Counterfactual Explanations),并评估了它的效果。 通过这种方法,我们就能重新定义模型的分类标准,从而解释AI
量子位
2022/07/04
4960
斑马识别成狗,AI犯错的原因被斯坦福找到了丨开源
斯坦福研究人员利用AI自动检测老年痴呆,准确率达到94%
根据阿尔茨海默病协会的统计,在美国,估计有570万的人患有阿尔茨海默病。这包括550万65岁及以上的人和约20万65岁以下发病的阿尔茨海默氏病的人。为了帮助医生诊断这种疾病,斯坦福大学的研究人员开发了一种基于深度学习的系统,可以自动检测阿尔茨海默病及其生物标志物,准确率为94%。
AiTechYun
2018/10/25
4250
斯坦福研究人员利用AI自动检测老年痴呆,准确率达到94%
斯坦福大学研究人员利用AI生成表情包
目前,人工智能可以做许多事情,比如从2D图片生成物体的3D模型,击败面部识别系统或识别野生动物,现在它也能生成表情包了。
AiTechYun
2018/07/27
4950
斯坦福大学研究人员利用AI生成表情包
斯坦福「基础模型研究中心」华人Percy Liang任主任,业界炮轰:深度学习做不了基础模型!
八月,斯坦福大学的研究人员在arxiv 上传了一篇报告,宣布人工智能的新时代已经到来,一个建立在巨大的神经网络和数据海洋之上的时代。
新智元
2021/10/12
7700
Pika 2.0横扫Sora惊艳全网,一键颠覆广告业!上传自拍秒变好莱坞大片,和明星同框不是梦
十一期间,Pika凭借万物皆可捏捏、融化和挤爆的网红特效,迅速在全网形成病毒式传播,引爆整个社交媒体。
新智元
2025/02/15
1130
Pika 2.0横扫Sora惊艳全网,一键颠覆广告业!上传自拍秒变好莱坞大片,和明星同框不是梦
斯坦福发布首份 AI Index 报告,AI 研究者不再茫然
前不久斯坦福大学计算机科学教授,前谷歌首席科学家 Yoav Shoham 来到中国做了场《人工智能的过去、现在和未来》的报告,对人工智能的发展历史、现在所面临的困境以及如何克服这些困境做了非常精彩的分享,此外还重点讲述了他一年来主导的AI Index(see https://aiindex.org/)。 「AI Index」是什么? 这要从 2014 年说起,当时斯坦福大学决定启动一个叫做「AI100」的项目 - 人工智能百年研究。其目标简单来说就是持续地去调查、总结人工智能未来 100 年在学术研究、
企鹅号小编
2018/01/19
9390
斯坦福发布首份 AI Index 报告,AI 研究者不再茫然
对于AIGC,李飞飞有这些看法|斯坦福HAI观点报告
---- 新智元报道   编辑:Ellie 桃子 【新智元导读】近期生成式AI大热,这为人类社会带来可观的机遇,但也伴随着巨大的风险。斯坦福HAI研究院发布对观点报告,带来对生成式AI的见解。 近日,李飞飞领导的斯坦福HAI研究院发布了关于「生成式AI」的观点报告。 报告指出,当前大多数生成式人工智能都是由基础模型驱动的。 这些模型为我们的生活、社区以及社会带来的机会是巨大的,与此同时带来的风险也一样。 一方面,生成式AI可以让人类更有生产力和创造力。另一方面,它们可能会放大社会偏见,甚至破坏我们对
新智元
2023/03/29
3500
对于AIGC,李飞飞有这些看法|斯坦福HAI观点报告
为非专业人员量身打造,斯坦福教授Christopher Manning一页纸定义AI核心概念
机器之心报道 编辑:魔王、小舟 斯坦福教授 Christopher Manning 用一页纸的篇幅介绍 AI 领域的核心概念。 在「AI」随处可见的当下,你真的理解人工智能领域核心概念吗? 刚刚,斯坦福大学教授、人工智能实验室(SAIL)负责人、HAI 副主任 Christopher Manning 用一页纸的篇幅定义了 AI 领域的核心术语。他表示希望这些定义能够帮助非专业人员理解 AI。 在这一页纸中,Manning 介绍了十多个术语的定义,包括「智能」、「人工智能」、「机器学习」、「深度学习」等。
机器之心
2023/03/29
3960
为非专业人员量身打造,斯坦福教授Christopher Manning一页纸定义AI核心概念
推荐阅读
如何光明正大地学习KISS?当然是用这个DL接吻检测器了
6290
来自亚马逊、NEC 和斯坦福的 AI 研究人员推出了第一个深度视频文本替换方法“STRIVE”
6050
从复活巨星到修复老电影,细数AI在电影领域的打开方式
9270
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
3070
斯坦福医疗ImageNet发布,如何评价PB级医疗影像数据集?
1.5K0
学界 | 斯坦福最新:用GAN补全镜头外的世界
3090
真假费德勒大战!斯坦福出品AI模型一键生成温网决赛
5450
找不出破绽!斯坦福等新研究:随意输入文本,改变视频人物对白,逼真到让作者害怕
6500
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
1520
斯坦福大学开发自主无人机摄影的算法,可显著提高电影中无人机镜头品质
4640
48小时封镜!这是一部完全由AI制作的科幻电影
8390
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
3040
斑马识别成狗,AI犯错的原因被斯坦福找到了丨开源
4960
斯坦福研究人员利用AI自动检测老年痴呆,准确率达到94%
4250
斯坦福大学研究人员利用AI生成表情包
4950
斯坦福「基础模型研究中心」华人Percy Liang任主任,业界炮轰:深度学习做不了基础模型!
7700
Pika 2.0横扫Sora惊艳全网,一键颠覆广告业!上传自拍秒变好莱坞大片,和明星同框不是梦
1130
斯坦福发布首份 AI Index 报告,AI 研究者不再茫然
9390
对于AIGC,李飞飞有这些看法|斯坦福HAI观点报告
3500
为非专业人员量身打造,斯坦福教授Christopher Manning一页纸定义AI核心概念
3960
相关推荐
如何光明正大地学习KISS?当然是用这个DL接吻检测器了
更多 >
交个朋友
加入腾讯云官网粉丝站
蹲全网底价单品 享第一手活动信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档