Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >总结 | 2020年TOP 10计算机视觉论文:代码,解读,还有demo视频!

总结 | 2020年TOP 10计算机视觉论文:代码,解读,还有demo视频!

作者头像
OpenCV学堂
发布于 2021-01-07 10:36:58
发布于 2021-01-07 10:36:58
1.6K0
举报

作者:louisfb01 编译:ronghuaiyang

导读

论文,代码,解读,还有demo视频。

尽管今年世界上发生了这么多事情,我们还是有机会看到很多惊人的研究成果。特别是在人工智能更精确的说是计算机视觉领域。此外,今年还聚焦了许多重要的方面,比如伦理方面、重要的偏见等等。人工智能和我们对人类大脑及其与人工智能的联系的理解在不断发展,在不久的将来显示出了有前途的应用,这一点我一定会讲到。

以下是我今年在计算机视觉领域最有趣的10篇研究论文,以免你错过了其中的任何一篇。简而言之,它基本上是一个关于人工智能和CV的最新突破的精选列表,配有清晰的视频解释、更深入的文章链接和代码(如果适用的话)。好好享受吧,如果我在评论中漏掉了什么重要的论文,请告诉我,或者直接在LinkedIn上联系我!

观看完整的5分钟计算机视觉2020回顾

视频链接:https://youtu.be/CP3E9Iaunm4

完整的论文列表

  • Sea-thru: A Method For Removing Water From Underwater Images
  • Neural circuit policies enabling auditable autonomy
  • NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis
  • YOLOv4: Optimal Speed and Accuracy of Object Detection
  • PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models
  • Image GPT - Generative Pretraining from Pixels
  • DeepFaceDrawing: Deep Generation of Face Images from Sketches
  • PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
  • RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
  • Learning Joint Spatial-Temporal Transformations for Video Inpainting
  • Old Photo Restoration via Deep Latent Space Translation
  • Is a Green Screen Really Necessary for Real-Time Portrait Matting?
  • DeOldify

Sea-thru: A Method For Removing Water From Underwater Images

你有没有想过,如果没有水,海洋会是什么样子,去掉了这蓝绿色的水下照片,仍然有珊瑚礁的真实颜色?利用计算机视觉和机器学习算法,Haifa大学的研究人员能够做到这一点!

  • 视频短片:视频链接:https://youtu.be/E1kffL4_AS8
  • 论文解读:https://medium.com/towards-artificial-intelligence/this-ai-removes-the-water-from-underwater-images-d277281bcd0f
  • 论文链接:https://openaccess.thecvf.com/content_CVPR_2019/papers/Akkaynak_Sea-Thru_A_Method_for_Removing_Water_From_Underwater_Images_CVPR_2019_paper.pdf
  • 代码:https://github.com/jgibson2/sea-thru

Neural circuit policies enabling auditable autonomy

来自奥地利IST和麻省理工学院的研究人员已经成功地使用一种新的人工智能系统训练了一辆自动驾驶汽车,该系统基于小动物的大脑,比如蛲虫。他们只用几个神经元就能控制自动驾驶汽车,而流行的深度神经网络如inveptions、Resnets或VGG需要数百万个神经元。他们的网络能够完全控制一辆汽车,只需要使用由19个控制神经元组成的75000个参数,而不是数百万个!

  • 短片:https://youtu.be/wAa358pNDkQ
  • 论文解读:https://medium.com/towards-artificial-intelligence/a-new-brain-inspired-intelligent-system-drives-a-car-using-only-19-control-neurons-1ed127107db9
  • 论文链接:https://www.nature.com/articles/s42256-020-00237-3.epdf?sharing_token=xHsXBg2SoR9l8XdbXeGSqtRgN0jAjWel9jnR3ZoTv0PbS_e49wmlSXvnXIRQ7wyir5MOFK7XBfQ8sxCtVjc7zD1lWeQB5kHoRr4BAmDEU0_1-UN5qHD5nXYVQyq5BrRV_tFa3_FZjs4LBHt-yebsG4eQcOnNsG4BenK3CmBRFLk%3D
  • 代码:https://github.com/mlech26l/keras-ncp

NeRV: Neural Reflectance and Visibility Fields for Relighting and View Synthesis

该方法能够生成一个完整的三维场景,并能够决定场景的照明。与以前的方法相比,所有这些都只需要非常有限的计算成本并得到了惊人的结果。

  • 短片:https://youtu.be/ZkaTyBvS2w4
  • 论文解读:https://medium.com/what-is-artificial-intelligence/generate-a-complete-3d-scene-under-arbitrary-lighting-conditions-from-a-set-of-input-images-9d2fbce63243
  • 论文链接:https://arxiv.org/abs/2012.03927
  • 代码:https://people.eecs.berkeley.edu/~pratul/nerv/

YOLOv4: Optimal Speed and Accuracy of Object Detection

这第4个版本由Alexey Bochkovsky等人于2020年4月在论文“YOLOv4: Optimal Speed and Accuracy of Object Detection”中介绍。该算法的主要目标是在高精度方面做出一个高质量的超高速目标检测器。

  • 短片:https://youtu.be/CtjZFkO5RPw
  • 论文解读:https://medium.com/what-is-artificial-intelligence/the-yolov4-algorithm-introduction-to-you-only-look-once-version-4-real-time-object-detection-5fd8a608b0fa
  • 论文链接:https://arxiv.org/abs/2004.10934
  • 代码:https://github.com/AlexeyAB/darknet

PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Model

这个新算法将模糊的图像转换成高分辨率的图像!它可以把超低分辨率的16x16图像转换成1080p高清晰度的人脸!你不相信我?你就可以在不到一分钟的时间里自己试一下!但首先,让我们看看他们是怎么做到的。

  • 短片:https://youtu.be/cgakyOI9r8M
  • 论文解读:https://medium.com/what-is-artificial-intelligence/this-ai-makes-blurry-faces-look-60-times-sharper-7fcd3b820910
  • 论文链接:https://arxiv.org/abs/2003.03808
  • 代码:https://github.com/adamian98/pulse

Image GPT - Generative Pretraining from Pixels

一个好的人工智能,比如Gmail中使用的那个,可以生成连贯的文本并完成你的短语。这张图片使用了同样的原则来完成一张图片!所有这些都是在无人监督的训练中完成的,根本不需要任何标签!

  • 短片:https://youtu.be/FwXQ568_io0
  • 论文解读:https://medium.com/towards-artificial-intelligence/this-ai-can-generate-the-pixels-of-half-of-a-picture-from-nothing-using-a-nlp-model-7d7ba14b5522
  • 论文链接:https://openai.com/blog/image-gpt/
  • 代码:https://github.com/openai/image-gpt

DeepFaceDrawing: Deep Generation of Face Images from Sketches

你现在可以使用这种新的图像到图像转换技术,从粗糙甚至不完整的草图生成高质量的人脸图像,无需绘图技巧!如果你的画技和我一样差,你甚至可以调整眼睛、嘴巴和鼻子对最终图像的影响。让我们看看它是否真的有效,以及他们是如何做到的。

  • 短片:https://youtu.be/djXdgCVB0oM
  • 论文解读:https://medium.com/what-is-artificial-intelligence/ai-generates-real-faces-from-sketches-8ccbac5d2b2e
  • 论文链接:http://geometrylearning.com/paper/DeepFaceDrawing.pdf
  • 代码:https://github.com/IGLICT/DeepFaceDrawing-Jittor

PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization

这个人工智能从2D图像生成3D高分辨率的人的重建!它只需要一个单一你的图像就可以生成一个3D头像,看起来就像你,甚至从背后!

  • 短片:https://youtu.be/ajWtdm05-6g
  • 论文解读:https://medium.com/towards-artificial-intelligence/ai-generates-3d-high-resolution-reconstructions-of-people-from-2d-images-introduction-to-pifuhd-d4aa515a482a
  • 论文链接:https://arxiv.org/pdf/2004.00452.pdf
  • 代码:https://github.com/facebookresearch/pifuhd

RAFT: Recurrent All-Pairs Field Transforms for Optical Flow

ECCV 2020最佳论文奖授予普林斯顿团队。他们开发了一种新的端到端可训练的光流模型。他们的方法在多个数据集上超越了最先进的架构的准确性,而且效率更高。

  • 短片:https://youtu.be/OSEuYBwOSGI
  • 论文解读:https://medium.com/towards-artificial-intelligence/eccv-2020-best-paper-award-a-new-architecture-for-optical-flow-3298c8a40dc7
  • 论文链接:https://arxiv.org/pdf/2003.12039.pdf
  • 代码:https://github.com/princeton-vl/RAFT

Learning Joint Spatial-Temporal Transformations for Video Inpainting

这个人工智能应用可以填补移除了目标之后丢失的像素,并使用更精确,更少模糊的方式重建整个视频。

  • 短片:https://youtu.be/MAxMYGoN5U0
  • 论文解析:https://medium.com/towards-artificial-intelligence/this-ai-takes-a-video-and-fills-the-missing-pixels-behind-an-object-video-inpainting-9be38e141f46
  • 论文链接:https://arxiv.org/abs/2007.10247
  • 代码:https://github.com/researchmm/STTN?utm_source=catalyzex.com

Old Photo Restoration via Deep Latent Space Translation

想象一下,你祖母18岁时的老照片,折叠的,甚至是被撕的,全部变成高清的,没有任何手工痕迹的照片。这就是所谓的旧照片修复,而这篇论文刚刚开辟了一个全新的途径来解决这个问题,使用深度学习方法。

  • 短片:https://youtu.be/QUmrIpl0afQ
  • 论文解析:https://medium.com/towards-artificial-intelligence/old-photo-restoration-using-deep-learning-47d4ab1bdc4d
  • 论文链接:https://arxiv.org/pdf/2009.07047.pdf
  • 代码:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life?utm_source=catalyzex.com

Is a Green Screen Really Necessary for Real-Time Portrait Matting?

人像抠图是一项非常有趣的任务,目标是在照片中找到所有的人,然后把背景去掉。由于任务的复杂性,这真的很难实现,必须找到一个或多个拥有完美轮廓的人。在这篇文章中,我回顾了多年来使用的最佳技术,以及2020年11月29日发表的一篇新方法。许多技术使用基本的计算机视觉算法来实现这一任务,例如GrabCut算法,它非常快,但不是非常精确。

  • 短片:https://youtu.be/rUo0wuVyefU
  • 论文解读:https://medium.com/datadriveninvestor/high-quality-background-removal-without-green-screens-8e61c69de63
  • 论文链接:https://arxiv.org/pdf/2011.11961.pdf
  • 代码:https://github.com/ZHKKKe/MODNet

DeOldify

DeOldify是一种对黑白图像甚至电影胶片进行着色和还原的技术。它是由Jason Antic一人开发的,目前仍在进行更新。它现在是给黑白图像着色的最先进的方法,而且所有的东西都是开源的,但是我们将会回到这一点上。

  • 短片:https://youtu.be/1EP_Lq04h4M
  • 论文解读:https://medium.com/towards-artificial-intelligence/this-ai-can-colorize-your-black-white-photos-with-full-photorealistic-renders-deoldify-bf1eed5cb02a
  • 代码:https://github.com/jantic/DeOldify

—END—

英文原文:https://github.com/louisfb01/Top-10-Computer-Vision-Papers-2020

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
资源 | 一文掌握机器学习所有值得看的视频、课程、工具
越来越多的开发者和学习者转投人工智能,但很多人鉴于跨行的难度,并不知道如何开始学习人工智能和机器学习。本文是作者Arun Agrahri整理的一些优秀文章,内容包括启发阅读和学习资源以及工具,希望能对你有所帮助。 启发性阅读 还不大了解人工智能行业的小伙伴可以看看以下文章,如果你已经转型AI,可跳过…… https://www.technologyreview.com/s/534871/our-fear-of-artificial-intelligence/ https://www.techn
AI科技大本营
2018/04/27
5770
资源 | 一文掌握机器学习所有值得看的视频、课程、工具
2021年不可错过的40篇AI论文,你都读过吗?
2021即将结束了,你今年读了多少论文? 虽然世界仍在从新冠疫情的破坏中复苏,人们无法向从前那样时常线下相聚、共同探讨交流关于学术领域的最新问题,但AI研究也没有停下跃进的步伐。 转眼就是2021年底了,一年就这么就过去了,时光好像被偷走一样。细细数来,你今年读了多少论文? 一名加拿大博主Louis Bouchard以发布时间为顺序,整理出了近40篇2021年不可错过的优秀论文。整体来看,合集中的论文偏重计算机视觉方向。 在这个15分钟左右的视频中,你可以快速浏览这些论文: http://mpvide
机器之心
2021/12/28
9570
2021年不可错过的40篇AI论文,你都读过吗?
年终收藏! 一文看尽2020年度最「出圈」AI论文合集
疫情之下,通过各种方式,全球的研究者继续积极合作,发表了许许多多有影响力的成果——特别是在人工智能领域。
新智元
2020/12/25
7701
2020年计算机视觉技术最新学习路线总结 (含时间分配建议)
如今有大量的资源可以用来学习计算机视觉技术,那我们如何从众多教程中进行选择呢?哪个值得我们去投入时间呢?
AI算法与图像处理
2020/08/28
12.6K0
2020年计算机视觉技术最新学习路线总结 (含时间分配建议)
[计算机视觉论文速递] 2018-06-19 CVPR 2018专场
这篇文章有4篇论文速递,都是CVPR 2018论文,包括zero-shot learning、图像合成和图像转换等方向。
Amusi
2018/07/24
7080
[计算机视觉论文速递] 2018-06-19 CVPR 2018专场
[计算机视觉论文速递] 2018-03-05
通知:这篇推文有16篇论文速递信息,涉及目标检测、图像分割、风格迁移和GAN等方向。 [1]《Hashing with Mutual Information》 2018 IEEE PAMI Abstract:论文提出一种基于信息理论量、互信息(mutual)优化的监督哈希(hashing)方法。论文表明,优化互信息可以减少学习汉明空间中诱导邻域结构中的歧义,这对于获取高检索性能是至关重要的。为此,论文对minibatch随机梯度下降的深度神经网络中的互信息进行了优化,并提出了最大限度有效地利用现有监督的公式
Amusi
2018/04/12
7580
[计算机视觉论文速递] 2018-03-05
2020年,那些令人印象深刻的AI论文
Alexey Bochkovsky 等人于 2020 年 4 月在论文“YOLOv4: 目标检测的最佳速度和精度”中介绍它的第 4 个版本。该算法的主要目标是制作一个高精度、高质量的超高速目标检测器。
昱良
2021/01/25
5850
资源 | 生成对抗网络新进展与论文全集
选自GitHub 参与:蒋思源、吴攀 生成对抗网络(GAN)是近段时间以来最受研究者关注的机器学习方法之一,深度学习泰斗 Yann LeCun 就曾多次谈到 这种机器学习理念的巨大价值和未来前景。在本文中,机器之心总结了 GitHub 上两篇关于 GAN 的资源,其中一篇介绍了 GAN 的一些引人关注的新理论和实践(如 Wasserstein GAN),另一篇则集中展示了大量 GAN 相关的论文。 以下是两篇原文的链接: GAN 理论&实践的新进展:https://casmls.github.io/gene
机器之心
2018/05/07
7860
资源 | 生成对抗网络新进展与论文全集
解读 | 2019 年 10 篇计算机视觉精选论文(中)
内容一览:2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,我们精选了 2019 年十大 CV 研究论文,帮你了解该领域的最新趋势。
HyperAI超神经
2019/12/25
5650
简单盘点 CVPR2020 的图像合成论文
本文将简单盘点在 CVPR2020 上的图像合成方面的论文,然后给出下载地址以及开源代码 github(如果有开源)。
kbsc13
2020/08/06
9280
2021年必读的10 个计算机视觉论文总结
世界的经济活动在病毒的冲击下陷入了历史罕见的停滞中,但研究并没有放慢其狂热的步伐,尤其是在人工智能领域。今年的论文中除了一般的研究结果外还强调了许多重要方面,例如道德方面、重要偏见、治理、透明度等等。人工智能和我们对人脑及其与人工智能的联系的理解不断发展,显示出在不久的将来改善我们生活质量的有前景的应用。不过,我们应该谨慎选择应用哪种技术。
公众号机器学习与AI生成创作
2022/02/28
1.3K0
2021年必读的10 个计算机视觉论文总结
不可错过的 GAN 资源:教程、视频、代码实现、89 篇论文下载
【新智元导读】这是一份生成对抗(神经)网络的重要论文以及其他资源的列表,由 Holger Caesar 整理,包括重要的 workshops,教程和博客,按主题分类的重要论文,视频,代码等,值得收藏学习。 目录 Workshops 教程 & 博客 论文 理论 & 机器学习 视觉应用 其他应用 幽默 视频 代码 Workshops NIP 2016 对抗训练 Workshop 【网页】https://sites.google.com/site/nips2016adversari
新智元
2018/03/28
2.4K0
解读 | 2019 年 10 篇计算机视觉精选论文(上)
内容一览:2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,我们精选了 2019 年十大 CV 研究论文,帮你了解该领域的最新趋势。
AI算法与图像处理
2019/12/23
5980
解读 | 2019 年 10 篇计算机视觉精选论文(上)
一文带你读懂计算机视觉
最近,我已经阅读了很多与计算机视觉相关的资料并做了大量实验,这里介绍了在该领域学习和使用过程中有意思的内容。
AI研习社
2018/12/26
6230
CVPR 2022 论文和开源项目合集
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 【CVPR 2022 论文开源目录】 Backbone CLIP GAN NAS NeRF Visual Transformer 视觉和语言(Vision-Language) 自监督学习(Self-supervised Learning) 数据增强(Data Augmentation) 目标检测(Object Detection) 目标跟踪(Visual Tracking) 语义分割(Semantic Segment
机器学习AI算法工程
2022/03/24
1.2K0
计算机视觉学术速递[7.21]
访问www.arxivdaily.com获取含摘要速递,涵盖CS|物理|数学|经济|统计|金融|生物|电气领域,更有搜索、收藏、发帖等功能!点击阅读原文即可访问 cs.CV 方向,今日共计45篇 Tr
公众号-arXiv每日学术速递
2021/07/27
1.7K0
计算机视觉学术速递[8.30]
【1】 Evaluating Transformer based Semantic Segmentation Networks for Pathological Image Segmentation 标题:基于Transformer的语义分割网络在病理图像分割中的评价 链接:https://arxiv.org/abs/2108.11993
公众号-arXiv每日学术速递
2021/09/16
7740
Top 50机器学习项目实战总结
整理 | 胡永波 根据《纽约时报》的说法,“在硅谷招募机器学习工程师、数据科学家的情形,越来越像NFL选拔职业运动员,没有苛刻的训练很难上场了。”毕竟,高达124472美元的平均年薪可不是谁想挣就能挣到的。 正如职业运动员每天都要训练一样,机器学习的日常练习也是工程师生涯得以大踏步前进的基本保障。仅2017年一年,机器学习领域总结此类实战经验的文章便已超过20000篇,该领域相关职位的热度自是可见一斑。 从中,我们筛选出50篇最好的经验和心得,囊括了机器学习在15大细分领域的各项典型应用: 图像处理
企鹅号小编
2018/02/02
2K0
Top 50机器学习项目实战总结
[计算机视觉论文速递] 2018-03-07
通知:这篇推文有18篇论文速递信息,涉及目标检测、图像分割和GAN等方向。 [1]《A new stereo formulation not using pixel and disparity models》 Abstract:我们介绍一种不使用像素和视差模型的新立体公式。视觉中的许多问题被视为为每个像素分配一个标签。差异是立体的标签。这样的像素标签问题自然地以能量最小化的方式表示,其中能量函数有两个项:一个项惩罚与观察数据不一致的解,另一个项强制空间平滑度。图形切割是解决能量最小化的有效方法之一。然而,
Amusi
2018/04/12
1.1K0
[计算机视觉论文速递] 2018-03-07
【2019 NLP汇总】论文、博客、教程、工程进展全梳理(长文预警)
2019 年对自然语言处理(NLP)来说是令人印象深刻的一年。本文将着重讲述一些 2019 年我在机器学习和自然语言处理领域有所见闻的重要事件。我会把重点主要放在自然语言处理上,但也会涉及若干人工智能领域的趣闻。主要内容包括研究论文、博客、工具和数据集、社区讨论、教程资源等。
zenRRan
2020/02/27
1.1K0
推荐阅读
相关推荐
资源 | 一文掌握机器学习所有值得看的视频、课程、工具
更多 >
LV.0
OpenCV开发专家计算机视觉开发
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档