Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle

CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle

作者头像
机器之心
发布于 2018-05-09 07:33:39
发布于 2018-05-09 07:33:39
1.3K0
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

参与:机器之心编辑部

2017 年 7 月 18 日,ImageNet 最后一届挑战赛成绩已经公布,多个国内院校和企业在各个比赛项目上取得了非常不错的成绩。据官网信息,在 CVPR 2017 期间也会有一场 Workshop 以纪念 ImageNet 挑战赛。当地时间 7 月 26 日,李飞飞与 Jia Deng 在 ImageNet Workshop 上做主题演讲,对 8 年的 ImageNet 挑战赛历史进行了总结,并宣布之后的 ImageNet 挑战赛将转由 Kaggle 主办。最后,感谢李飞飞教授提供的 PPT,以及对本文内容的确认。

在 CVPR 2017 的 ImageNet Workshop 中,演讲者介绍了挑战赛的结果,回顾了物体识别领域的顶尖成果。同时,也有挑战赛获胜者介绍研究成果在产业中的部署等。在李飞飞与 Deng Jia 的演讲中,两位演讲者对 8 年的 ImageNet 挑战赛进行了回顾与总结,以下是基于 PPT 对演讲内容的介绍:

始于 CVPR 2009

ImageNet 始于 2009 年,当时李飞飞、Jia Deng 等研究员在 CVPR 2009 上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文,之后就是 7 届 ImageNet 挑战赛的开始(2010 年开始)。

8 年来,ImageNet 这篇论文对业内有极大的影响。在 Google Scholar 上,该论文有 4386 的引用量。另一篇论文《ImageNet Large Scale Visual Recognition Challenge》(2015),也有 2847 的引用量,这篇论文描述了 ImageNet 数据集基准的创造、物体识别领域的研究进展。

众多 ImageNet 挑战赛的参与者发展成了创业公司,其中包括机器之心很早就关注到的图像识别创业公司 Clarifai(机器之心 AI00 获奖者)、被谷歌收购的 DNNresearch。

ImageNet 的历史

在演讲中,演讲者首先介绍了 2009 年之前的图像数据集历史:从 1998 年 CMU 的 Vasc Faces 到 2008 年的 TinyImage 数据集。

也介绍了当时机器学习中的多种问题:复杂性、泛化、过拟合等。

如此,衍生出了一种新的思维方式:对视觉识别的关注点,从模型转移到数据。

从 1990 年开始到 2010 年,互联网数据的量级有了极大的增长,满足了发展机器学习的数据需求。

在这里,演讲者对 Wordnet 项目进行了介绍,ImageNet 的层级结构正是从 WordNet 之中派生出来的。

在 20 世纪 80 年代末,普林斯顿大学的心理学家 George Miller 启动了一个名为 WordNet 的项目,旨在构建英文语言层级结构的模型。它就像某种形式的字典一样,但是每个单词都会与其他相关的词相联系——而非以字母表形式呈现。例如,在 WordNet 中,单词「dog」在单词「canine」之下,而后者在「mammal」目录之下,往上往下都有更多的层级。这是为了让语言组织成为机器可读的逻辑,它已经积累了超过 155,000 个单词。

之后,ImageNet 的研究员(包括当时普林斯顿大学博士 Jia Deng、普林斯顿大学教授 Kai Li ) 基于 WordNet 发展出 ImageNet 的层级结构。

第一步:基于 WordNet 的本体结构

第二步:为来自互联网的数千张图像填入类别

第三步:手动清洁结果

发布 ImageNet 的三个尝试

这部分,演讲者介绍了 ImageNet 发起者们为推进 ImageNet 所做的三个尝试。

第一种方式:心理学实验,但这种方式会非常耗时间。

第二种方式:人类参与的解决方案。机器生成的数据集只能匹配一时的最佳算法,而人类生成的数据集超越了算法限制,能够生成更好的机器感知。

第三种方式:众包

通过亚马逊 mechanical turk 平台,来自 167 个国家的 4 万 9 千名工作者用 3 年(2007-2010)努力成就了 ImageNet。

演讲者介绍说,他们的量级目标是 1500 万,还有更高的清晰度、更高质量的标注、免费等。

惊人的成就

一张图总结 2010-2016 年的 ImageNet 挑战赛成果:分类错误率从 0.28 降到了 0.03;物体识别的平均准确率从 0.23 上升到了 0.66。

为了让 ImgaNet 变得更好,发起者们也做了许多细节工作,比如图像量、物体种类的倍数级增加。

ILSVRC 检测的评估需要注解所有出现的类别,从而对虚假检测做出惩罚。ILSVRC 图像达 40 万张,类别数量为 200,注解有 8000 万个。

ILSVRC 检测的评估:分层注解。

细粒度识别。ImageNet 关于汽车的数据集中,汽车图像的数量达到了 70 万张,类别数量为 2567 个。

演讲者介绍了 ImageNet 所取得的意料之中的成果。主要包括三个方面:1. ImageNet 成为了计算机视觉识别领域的标杆;2. 物体识别领域取得了前所未有的突破;3. 机器学习获得了长足发展,同时变化也很大。

除此之外,还取得了一些意料之外的成果:神经网络再一次流行起来,并且越来越流行。演讲者举例进行了说明。在使用深度卷积神经网络进行 ImageNet 分类任务中,有一篇成果显著的论文,即《imagenet classification with deep convolutional neural networks》(Krizhevsky, Sutskever & Hinton, NIPS 2012),该论文摘要如下:我们训练了一个大型的深度卷积神经网络,把 ILSVRC 2010 训练集中的 130 万高分辨率图像分为了 1000 个不同的类别。在测试数据中,我们获得了 top1 和 top 5 的误差率,分别是 39.7\% 和 18.9\%。该论文的引用数量为 13259,神经网络之火热可见一斑。同时演讲者还给出了该深度卷积神经网络的图示。

随后,神经网络变得越来越流行,并出现了多种优秀变体,可谓百花齐放,比如 AlexNet、GoogLeNet、VGG Net、ResNet。相信这些神经网络大家并不陌生。其中出现较早的是 2012 年的 AlexNet,它最早在 [Krizhevsky et al. NIPS 2012] 被提出;新近出现的是 2016 年的 ResNet,它在上年的 CVPR 中被提出,刚好一年。这些变体之间是一种前后相继、不断迭代的关系,同时又发挥着各自的独特作用。

神经网络流行的同时,网络上的图像数据量有了爆发性的增长,GPU 的性能也在飞速提升,三者合力的结果就是为人类带来了一场席卷全球的深度学习革命。

接下来讲一下本体结构:一种不太常用的结构。

如图所示,这是一只袋熊,那么如何把这种图像识别为一只袋熊呢?方法是最大化特征 ( f ) 使其符合精确度 ( f ) ≥ 1 - ε。

使用本体结构开展的工作相对来讲依然很少(谷歌上只有 93 条结果),但并不妨碍有成果出现。ECCV 2012 最佳论文奖(Kuettel, Guillaumin, Ferrari.Segmentation Propagation inImageNet. ECCV 2012)就用到了本体结构。

机器视觉和人类视觉

自从 2012 卷积神经网络在计算机视觉上取得极大的成功后,我们一直在探索拥有更强大机器视觉的可能性。这也令大家都看到了近来计算机视觉所存在的局限,比如说小数据集训练,虽然我们能使用预训练模型进行迁移学习,但每一个类别仍然需要成百上千的标注图像。还有比如说分清视觉的本质和外在,人类很容易分清楚穿了驯鹿服的狗还是狗,但计算机却十分容易将其分类为驯鹿。这一些缺点都直接限制了计算机视觉的发展,那么计算机视觉和我们人类到底区别在哪?

如下所示,相对于 GoogLeNet,Top-5 误差率还是人类高一点,但如果使用近来最先进的模型,人类识别率却不一定比机器高。但识别误差率就是最关键的吗?

在计算视觉的机眼中,识别的物体永远都只是类别。如下所示,机器可以轻松地识别每个物体(如人和房间等),但是机器视觉也仅仅只能做到识别了,它不会思考这些人到底在干什么,他们为什么都站在这,他们之间的关系是什么。而人类即使识别物体的准确率可能还不及机器,但我们的视觉可以带给我们足够的信息以分析整个场景。

如下所示,人类的视觉不仅会告诉我们每个物体是什么,同时还会告诉我们物体间的关系、物体下一个时间步骤的动作或趋势以及情感细节等。对于这样的人类视觉,机器视觉还有很长的路要走,这也正是 ImageNet 所希望能促进的。

鉴于机器视觉和人类视觉之间的差距,我们因此希望计算机能描述其所见到的图像。如下所示,计算机可以在物体识别的基础上推断出物体间的关系,并结合 NLP 给出图像的描述。

总的来说,随着硬件和软件技术的发展,计算机视觉的技术正在不断进步,目前机器学习(深度学习)在常见图片的物体识别上已实现类似人类的识别水平。

不仅如此,目前的技术已经可以实现对一张复杂照片中的内容进行自然语言描述,并回答相应问题了。这说明深度学习可以理解图片中的内容,并将其转化为可掌握的知识。虽然这一过程还非常基础,但这有助于拉近机器与人类的距离。图像描述一般也有专用的数据集,例如 Visual Genome Dataset 等。该数据集如下有 4.2M 的图像描述和 1.5M 的关系标注,它是基于目标分类实现关系和情景推理的优秀数据集。ImageNet 的下一步很可能就要传递给这些开放、大规模、详细的数据集。

ImageNet 的未来

ImageNet 2017 挑战赛是最后一届,李飞飞在 CVPR 2017 上表明 ImageNet 挑战赛以后将与 Kaggle 结合。她在演讲中欣喜地表明她们正在将接力棒传递给 Kaggle,不仅因为 Kaggle 社区是最大的数据科学社区,同时还因为她们认为只有将数据做到民主化才能实现 AI 民主化。虽然 ImageNet 挑战赛是最后一届了,但 image-net.org 仍然会一直存在,并致力于为计算机视觉做出更大的贡献。

Kaggle 拥有超过百万的数据科学家,它能大大地促进更多人参与 ImageNet 挑战赛。从最开始的 AlexNet 到后来的残差网络,我们已经看到 ImageNet 挑战赛催生出了许多优秀的计算机视觉解决方案。也许 ImageNet 加上 Kaggle 能继续在目标识别、目标定位和视频目标识别等任务上实现更大的突破,并解决如模型小型化、快速训练和更强的迁移学习等问题。

经过多年的更新,现如今 ImageNet 已经有 13M(百万)标注图像,但各大科技公司都在构建自己更强劲的数据集。大公司希望能利用其自身用户所产生的海量图像、语音片段和文本片段来构建更大的数据集,而初创科技公司也开始通过各种渠道或互联网数据构建自身的大规模数据集。

开放和自由使用是 ImageNet 的宗旨,这也是 ImageNet 对计算机视觉社区做出的最大贡献。自 ImageNet 以来,很多科技巨头都陆续开放了大规模图像数据集。如谷歌在 2016 年发布了 Open Images 数据集,该数据集包含 6000 多个类别共计 9M 图像,还有 JFT-300M 数据集,该数据集有 300M 非精确标注的图像。因此 ImageNet 的未来可能会催生一批大规模开放数据集。

自 2010 年起,ImageNet 经历了多年的发展,其分类错误现已缩小到当初发布时的 1/10,而这意味着 3 倍的模型预测准确率提升。在未来,计算机视觉的发展将可以预测图片中事物的动作,理解图片中的 3D 环境,并用自然语言对所有这些作出解释。

随着与 Kaggle 合并,ImageNet 挑战赛将会接入这个拥有多达 100 万数据科学家的庞大社区之中,为更多人带来帮助——这与「人工智能民主化」的理念相呼应。与此同时,该项目的原网址 image-net.org 仍将由斯坦福大学继续运营。

「人们已经意识到,ImageNet 改变了人工智能领域,数据集是 AI 研究的核心之一,」李飞飞表示。「在研究中,数据集与算法同样重要。」

在未来,ImageNet 将继续举办物体定位挑战、物体识别挑战与视频物体识别挑战。

本文为机器之心报道,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-07-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)
【新智元导读】ImageNet 缔造者、斯坦福大学副教授、人工智能实验室主任李飞飞在刚刚结束的ICML2016会议发表演讲 A Quest for Computer Vision,介绍她所在的实验室用深度学习和大数据进行图像和视频理解的最新进展。新智元取得李飞飞教授授权,将PPT发布如下并摘选翻译。 人类视觉系统演化用了500万多年的时间,而人工智能计算机视觉发展只用了15年左右。 在以下演讲中,斯坦福副教授李飞飞将介绍计算机视觉的发展历程,尤其是她实验室用端到端的学习方法进行稠密图像描述的最新进展。 本
新智元
2018/03/26
1.5K0
【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)
CNCC | 李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁 | CNCC2017
AI 科技评论报道:中国计算机学会 CCF 举办的中国计算机大会CNCC 2017已于10月26日在福州市海峡国际会展中心开幕。参加会议的人数众多,主会场座无虚席。 AI 科技评论也派出记者团全程参与大会报道。 26日上午开幕式结束后,多位特邀嘉宾进行了现场演讲,主题涵盖计算机科学发展中的新技术和应用、自然语言利净额、AI如何服务于人、人工智能在信息平台的应用等等。斯坦福大学副教授、谷歌云首席科学家、机器学习界的标杆人物之一的李飞飞进行了题目为「A Quest for Visual Intelligen
AI科技评论
2018/03/14
1K0
CNCC | 李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁 | CNCC2017
ImageNet这八年:李飞飞和被她改变的AI世界
李杉 安妮 编译自 QZ 量子位 报道 | 公众号 QbitAI 2006年,李飞飞开始考虑一个想法。 当时刚刚出任伊利诺伊大学香槟分校计算机教授的她发现,整个学术圈和人工智能行业都在苦心研究同一个概
量子位
2018/03/28
1.8K0
ImageNet这八年:李飞飞和被她改变的AI世界
CV往哪卷?李飞飞指出三颗「北极星」:具身智能,视觉推理和场景理解
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】ImageNet见证了计算机视觉发展的辉煌历程,在部分任务性能已超越人类的情况下,计算机视觉的未来又该如何发展?李飞飞最近发文指了三个方向:具身智能,视觉推理和场景理解。 在深度学习革命进程中,计算机视觉依托大规模数据集ImageNet,在图像分类、目标检测、图像生成等多个任务都表现出惊人的性能,甚至比人类的准确率还要高! 但CV为何能取得如此巨大的成就?未来将向何处发展? 最近,「华人AI女神」李飞飞在美国文理科学院
OpenCV学堂
2022/05/05
8970
CV往哪卷?李飞飞指出三颗「北极星」:具身智能,视觉推理和场景理解
李飞飞:为什么计算机视觉对机器人如此重要? | IROS 2017
AI科技评论按:9 月 26 日,机器人领域的顶级学术会议 IROS 2017 进入第二日。上午,著名华人计算机视觉专家、斯坦福副教授李飞飞,在温哥华会议中心面向全体与会专家学者作了长达一小时的专题报告。 根据Guide2Research的排名,IROS是计算机视觉领域排名第四的学术会议,前三名分别为CVPR、ICCV、ECCV。计算机视觉在机器人的发展史中起着非常重要的作用,与之相关的“感知”也正是历年IROS大会上的重要内容,随着机器人研究的发展和“越来越接近人类”这个目标的进一步深入,越来越多的学者更
AI科技评论
2018/03/14
1.2K0
李飞飞:为什么计算机视觉对机器人如此重要? | IROS 2017
深度 | 最后一届ImageNet挑战赛落幕,「末代」皇冠多被国人包揽
选自LSVRC 2017 机器之心编译 参与:机器之心编辑部 近日,ImageNet 最后一届挑战赛成绩已经公布,多个国内院校和企业在各个比赛项目上取得了非常不错的成绩。奇虎和南京信息工程大学团队分别在定位任务和检测任务上取得了最佳成绩。本文将首先介绍本次的比赛情况,并简要介绍优秀团队的建模方法。同时我们也关注了 WebVision 挑战赛近日公布的结果。 在本次 ImageNet 竞赛中,南京信息工程大学和帝国理工学院的团队 BDAT 获得了目标检测的最优成绩,最优检测目标数量为 85、平均精确率为 0.
机器之心
2018/05/09
1.3K0
深度 | 最后一届ImageNet挑战赛落幕,「末代」皇冠多被国人包揽
AI科学家李飞飞告诉我们:超越 ImageNet 的视觉智能
说起人工智能,孕育了卷积神经网络和深度学习算法的 ImageNet 挑战赛恐怕是世界上最著名的 AI 数据集。8 年来,在 ImageNet 数据集的训练下,人工智能对于图像识别的准确度整整提高了 10 倍,甚至超越了人类视觉本身。
机器人网
2018/07/23
6630
AI科学家李飞飞告诉我们:超越 ImageNet 的视觉智能
李飞飞:World Labs这样实现「空间智能」
说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。
机器之心
2025/02/14
2440
李飞飞:World Labs这样实现「空间智能」
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
机器之心(海外)原创 作者:QW、CZ 参与:王灏、Panda 当地时间 7 月 21 日到 16 日,夏威夷火奴鲁鲁迎来了 2017 年计算机视觉与模式识别会议(CVPR)。今年的会议收到了 2620 份有效提交,其中有 783 篇论文被接收,其中又有 215 篇将进行长和短的演讲展示,分成了 3 个并行议程。本届会议吸引了 127 家赞助商,赞助资金 859000 美元。参会者数量接近 5000 人,在几年前才刚到 1000 人的基础上实现了显著的增长。本文带你回顾这场学术嘉年华(咖啡很赞!),不要错过
机器之心
2018/05/09
1.1K0
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
CNN太牛!微软计算机视觉在ImageNet挑战中首超人类视觉
Yann LeCun曾说,深度卷积神经网络(CNN)会“解决”ImageNet。但我们没想到进步会这么快。根据微软公司公布的信息,由于prelu激活函数和更好的初始化,微软亚洲研究院视觉计算组所开发的基于CNN的计算机视觉系统,在ImageNet 1000 挑战中首次超越了人类进行对象识别分类的能力。 微软研究团队在题为“Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification”的论
用户1737318
2018/06/05
2.3K0
现场 | CVPR 2018第一天:精彩的Workshop与被中国团队进击的挑战赛
前伯克利 CS 系主任 Jitendra Malik:研究 SLAM 需要结合几何和语义
机器之心
2018/07/26
6510
现场 | CVPR 2018第一天:精彩的Workshop与被中国团队进击的挑战赛
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
作为计算机视觉领域内最负盛名的学术会议,今年的 CVPR 已于当地时间 6 月 16 日在美国加州长滩开幕。
机器之心
2019/06/21
5020
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
华人包揽CVPR 2019两篇最佳论文,李飞飞ImageNet十年后获奖
有两篇论文,在CVPR 2019评审过程中,从5160篇投稿论文中杀出重围,分别获得最佳论文和最佳学生论文,而且这两篇论文的第一作者,都是华人。
量子位
2019/06/20
7270
华人包揽CVPR 2019两篇最佳论文,李飞飞ImageNet十年后获奖
深度学习十年后是撞墙了吗?Hinton、LeCun、李飞飞可不这么认为
选自venturebeat 作者:Sharon Goldman 机器之心编译 编辑:蛋酱、杜伟 深度学习未来会更好还是走下坡路?AI 圈先驱们展开了设想。 自 2012 年,以 AlexNet 为代表的深度学习技术突破开始,至今已有 10 年。 10 年后,如今已经成为图灵奖得主的 Geoffrey Hinton、Yann LeCun,ImageNet 挑战赛的主要发起人与推动者李飞飞如何看待过去十年的 AI 技术突破?又对接下来十年的技术发展有什么判断? 近日,海外媒体 VentureBeat 的一篇专访
机器之心
2022/09/20
3300
深度学习十年后是撞墙了吗?Hinton、LeCun、李飞飞可不这么认为
CVPR 2018视频行为识别挑战赛结果出炉:前三名均由国内团队包揽
Moment 是由 MIT-IBM Watson AI Lab 开发的研究项目。该项目致力于构建超大规模数据集来帮助 AI 系统识别和理解视频中的动作和事件。
朱晓霞
2018/07/23
7950
GMIS 2017嘉宾李佳:从Snapchat到谷歌,人工智能领域的「Another Badass Woman」
机器之心原创 作者:微胖、吴攀 李佳,谷歌云机器学习/人工智能研发负责人(Head of R&D, AI/ML, Senior Director at Cloud,Google)。本科毕业于中国科大自动化系。新加坡南洋理工大学硕士。在伊利诺伊大学香槟分校、普林斯顿大学与斯坦福大学跟随李飞飞从事计算机视觉研究。2011 年获斯坦福大学计算机科学博士。曾在谷歌实习,2011 年加入雅虎,2014 年成为雅虎资深研究员,开始领导雅虎实验室的视觉计算和机器学习部门。2015 年 2 月,Snapchat 聘请李佳担
机器之心
2018/05/07
9590
GMIS 2017嘉宾李佳:从Snapchat到谷歌,人工智能领域的「Another Badass Woman」
谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破
雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于深度学习的图像识别技术出现,极大地提高了计算机视觉的识别精确度,在一些特定场景下,机器的识别错误率已经远低于人眼识别的错误率。与此同时,研究员也发现在真实世界中,那些细粒度,实例级级别的物体识别还存在很大的挑战! 为了能使这一领域得到快速突破,谷歌向全球 CV 领域的开发者们发送了 iNaturalist 2018 挑战赛的邀请函。iNaturali
AI研习社
2018/03/28
1.5K0
谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破
30000$奖金+顶会分享 Google AI推出新的目标检测挑战赛
来源 | Towards Data Science 整理 | 磐石 【磐创AI导读】计算机视觉领域的又一大比赛盛宴,Google AI在kaggle竞赛平台上推出Open Images Challenges大规模目标检测竞赛。目标检测+视觉关系识别。奖金丰厚,同时还会将比赛结果分享在几月后的ECCV2018会议上。比赛直达链接见文末。欢迎大家关注我们的公众号:磐创AI。 就在几天前,Google AI在Kaggle上推出了一项名为Open Images Challenge的大规模目标检测竞赛。当今计算机视
磐创AI
2018/07/20
5070
李飞飞:在物体识别之后,计算机视觉还要多久才能理解这个世界?
AI科技评论按:9 月 26 日,机器人领域的顶级学术会议 IROS 2017 进入第二日。上午,著名华人计算机视觉专家、斯坦福副教授李飞飞,在温哥华会议中心面向全体与会专家学者作了长达一小时的专题报告。 在昨天发布的上篇 李飞飞:为什么计算机视觉对机器人如此重要? | IROS 2017中,李飞飞介绍了视觉对生物的重要性,以及计算机视觉在物体识别任务中的飞速发展。在下篇中,李飞飞继续与大家讨论了计算机视觉的下一步目标:丰富场景理解,以及计算机视觉与语言结合和任务驱动的计算机视觉的进展和前景。场景理解和与语
AI科技评论
2018/03/14
1.3K0
李飞飞:在物体识别之后,计算机视觉还要多久才能理解这个世界?
【谷歌升级ImageNet】大规模视觉理解竞赛WebVision冠军分享 | 新智元CVPR-17专题
【新智元导读】ImageNet 竞赛在今年正式完结。那么,图像识别未来的重点将是什么,ImageNet 竞赛之后又会出现什么呢?WebVision 竞赛被誉为接棒 ImageNet的大规模图像识别竞赛,今年有 100 多个团队参与。本文介绍 WebVision 竞赛,后附冠军团队码隆科技的技术分享。 2017 年 7 月 26 日,CVPR 2017 研讨会“超越 ILSVRC”将正式宣布 ImageNet 竞赛结束。然而,这并不代表着领域对图像识别兴趣的消退。实际上,相关的关注度正在走高。 ImageNe
新智元
2018/03/23
1.8K0
【谷歌升级ImageNet】大规模视觉理解竞赛WebVision冠军分享 | 新智元CVPR-17专题
推荐阅读
【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)
1.5K0
CNCC | 李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁 | CNCC2017
1K0
ImageNet这八年:李飞飞和被她改变的AI世界
1.8K0
CV往哪卷?李飞飞指出三颗「北极星」:具身智能,视觉推理和场景理解
8970
李飞飞:为什么计算机视觉对机器人如此重要? | IROS 2017
1.2K0
深度 | 最后一届ImageNet挑战赛落幕,「末代」皇冠多被国人包揽
1.3K0
AI科学家李飞飞告诉我们:超越 ImageNet 的视觉智能
6630
李飞飞:World Labs这样实现「空间智能」
2440
回顾 | CVPR 2017完全指北:深度学习与计算机视觉融合的一年,未来又会是什么?
1.1K0
CNN太牛!微软计算机视觉在ImageNet挑战中首超人类视觉
2.3K0
现场 | CVPR 2018第一天:精彩的Workshop与被中国团队进击的挑战赛
6510
华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
5020
华人包揽CVPR 2019两篇最佳论文,李飞飞ImageNet十年后获奖
7270
深度学习十年后是撞墙了吗?Hinton、LeCun、李飞飞可不这么认为
3300
CVPR 2018视频行为识别挑战赛结果出炉:前三名均由国内团队包揽
7950
GMIS 2017嘉宾李佳:从Snapchat到谷歌,人工智能领域的「Another Badass Woman」
9590
谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破
1.5K0
30000$奖金+顶会分享 Google AI推出新的目标检测挑战赛
5070
李飞飞:在物体识别之后,计算机视觉还要多久才能理解这个世界?
1.3K0
【谷歌升级ImageNet】大规模视觉理解竞赛WebVision冠军分享 | 新智元CVPR-17专题
1.8K0
相关推荐
【李飞飞最新演讲】斯坦福AI实验室图像与视觉理解技术进展(191PPT)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档