如果你想要的是一份从理论到实践的深度学习教程清单,如果你想系统了解各类框架、基础网络与各种使用场景,如果你缺一套即用即查的手边书——
夏乙 编译整理 量子位 出品 | 公众号 QbitAI “等代码吧。” 从Mask R-CNN论文亮相至今的10个月里,关于它的讨论几乎都会以这句话收尾。 现在,官方版开源代码终于来了。同时发布的,
目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
导读:目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
这周主要是对动态情景下的slam论文以及开源代码做了下收集,之前也解读过一篇类似的文献
在AI模型开发的过程中,许多开发者被不够充足的训练数据挡住了提升模型效果的脚步,一个拥有出色效果的深度学习模型,支撑它的通常是一个庞大的标注数据集。因此,提升模型的效果的通用方法是增加数据的数量和多样性。但在实践中,收集数目庞大的高质量数据并不容易,在某些特定领域与应用场景甚至难以获取大量数据。那么如何能在有限数据的情况下提升模型的效果呢?
计算机视觉领域一定要做物体检测! 从研究角度来看,物体检测是计算机视觉的根本问题之一,是很多高层视觉任务(如:图像分类、行人再辨识和目标跟踪)的基础。并且,现在国内外很多研究团队在对物体检测做深入的研究,近些年物体检测论文发表数量也呈逐年递增的趋势。 从应用角度来看,物体检测已经表广泛应用在我们的日常生活中,如人脸解锁、美颜相机、视频监控、淘宝拍立淘、百度识图等。 随着研究的深入以及广泛的落地应用,很多企业在招聘中对该领域人才要求越来越多,同时对物体检测技术的要求也越来越高。 调试代码仅是实现算法的手段
作者:breezecheng、morajiang、lyleleeli,腾讯 WXG 应用研究员 微信识图已经在微信的扫一扫识物,微信聊天/朋友圈/公众号长按图片搜一搜等场景上线,并且从最初的电商类目(鞋子、箱包、美妆、服装、家电、玩具、图书、食品、珠宝、家具等),扩展到更加丰富的万物场景,囊括了植物、动物、汽车、红酒、地标、菜品、名画、商标、作业以及其他通用场景。在算法架构上,微信识图主要由三大核心步骤组成,即为主体检测+子类目预测+子类目细粒度同款检索,开发一个高性能的检测器对于前两个步骤至关重要
微软亚洲研究院是国内顶级CV研究机构,众多CV黑科技的诞生地,2020年始,亚研院盘点了2019年CV领域重点论文,大部分附有开源代码,希望对大家有帮助。
FACEBOOK人工智能实验室何恺明博士领衔的Mask R-CNN喜提ICCV 2017最佳论文后,吸引了大量业内研究者的兴趣。
2017 年,英伟达发布了深度学习加速器 NVDLA,全称 NVIDIA DeepLearning Accelerator,以推动在定制硬件设计中采用高效的 AI 推理。
物体的互相遮挡在日常生活中普遍存在,严重的遮挡易带来易混淆的遮挡边界及非连续自然的物体形状,从而导致当前已有的检测及分割等的算法性能大幅下降。本文通过将图像建模为两个重叠图层,为网络引入物体间的遮挡与被遮挡关系,从而提出了一个轻量级的能有效处理遮挡的实例分割算法。
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文地址:https://arxiv.org/pdf/2104.11892.pdf 计算机视觉研究院专栏 作者:Edison_G 目标检测是对图像或视频中的目标进行分类和定位的任务。 由于其广泛的应用,近年来它已获得突出地位。 01 概述 今天分享中我们调查了基于深度学习的目标检测器的最新发展。还提供了检测中使用的基准数据集和评估指标的简明概述,以及检测任务中使用的一些突出的
网址:http://www.cvlibs.net/datasets/kitti/raw_data.php
AI 研习社按:近日,谷歌在其“谷歌开源”博客(Google Open Source )中发表一篇名为《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章,文中指出虽然谷歌的物体检测,图像识别机器学习系统很先进,但仍面临着很多挑战,比如如何提高识别精度。为此,谷歌将其物体检测系统代码开源,希望更多爱好者参与进来,共同推动研究领域的发展。我们对原文做了不改动愿意的整理和编译: 在谷歌,有为计算
AI科技评论按:6月15号,谷歌在其“谷歌开源”博客(Google Open Source )中发表一篇名为《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章,文中指出虽然谷歌的物体检测,图像识别机器学习系统很先进,但仍面临着很多挑战,比如如何提高识别精度。为此,谷歌将其物体检测系统代码开源,希望更多爱好者参与进来,共同推动研究领域的发展。AI科技评论对原文做了不改动愿意的整理编译: 在谷
两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于 10 月 27 日 - 11 月 2 日在韩国首尔举行。近期,大会官方公布了最终的论文接收决定,旷视研究院共有 11 篇论文被收录,研究领域涵盖通用物体检测及数据集、文字检测与识别、半监督学习、分割算法、视频分析、影像处理、行人及车辆再识别、模型压缩、度量学习、强化学习、元学习等众多领域。本文把 11 篇论文汇在一起,逐篇做了亮点抢先解读。
https://github.com/CoCoPIE-Pruning/CoCoPIE-ModelZoo/tree/master/YOLObile
AI 科技评论消息,9 月 8 日-14 日,2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,ECCV 每两年举办一次,与 CVPR、ICCV 共称为计算机视觉领域三大顶级学术会议,每年录用论文约 300 篇。根据 ECCV 2018 宣布的最终结果,商汤科技及联合实验室共有 37 篇论文入选,主要集中在以下领域:大规模人脸与人体识别、物体检测与跟踪、自动驾驶场景理解与分析、视频分析、3D 视觉、底层视觉算法、视觉与自然语言的综合理解等。此外,商汤科技在 2018 年 COCO 比赛物体检测(Detection)项目中夺得冠军,开源 mm-detection 检测库。凭借以上事项,商汤科技在雷锋网旗下学术频道 AI 科技评论数据库产品「AI 影响因子」中有相应加分。
【新智元导读】在谷歌研究院工作是一种怎样的体验?新智元近日专访了谷歌研究员朱梦龙,他作为谷歌团队G-RMI的核心成员,从去年9月开始一直盘踞在COCO的物体检测榜首。此外,他作为团队核心成员发布的最新研究MobileNet,通过分解降维卷积层,以及早期采用stride 2等,把计算量压缩至VGG的1/30,让终端模型的图像检测达到VGG的效果。谈到在谷歌研究院的体验,他认为就像在读PhD,跟一群天才(包括曾经在谷歌的贾扬清)一起讨论有趣的想法,以及做有意思的项目;不同的是,这些项目还能在现实中被广泛应用。
大数据文摘作品 作者:龙牧雪 冯晓丽 1月22日,Facebook的人工智能实验室(FAIR)开源了计算机视觉研究平台Detectron。Detectron系统实现了最先进的物体检测算法,包括Mask
机器之心原创 作者:景和 作为商业公司的百度正在积极推动开源文化。百度 COO 陆奇曾在内部讲话中表示,开源代码写得好,不仅能解决大家的痛点,开源的代码也会变得越来越强,开源代码的生命力也必然会超过封闭体系的代码。而百度的深度学习平台 PaddlePaddle 开源后,来自北京工业大学的 4 位学生利用其深度学习模型,制造了一台智能桃子分拣机。 2017 年夏天,果农刘连全的大桃有了别样的用途,为智能桃子分拣机提供了 6400 张照片。 北京工业大学的 4 位学生利用百度 PaddlePaddle 开源平台
AI 显然是最近几年非常火的一个新技术方向,从几年前大家认识到 AI 的能力,到现在产业里已经在普遍的探讨 AI 如何落地了。
还记得手把手教你做物体检测、手把手教你做命名实体识别系列的文章吗?满满的干货有没有O(∩_∩)O,大部分读者跟着步骤来,最后都实现了其中的物体检测和命名实体识别项目。 物体检测 [so8knag2el.png] [1elwy46k2p.png] 命名实体识别 [hc7uxqxp0o.png] 本系列文章,依然秉承实践为主,理论为辅,让大家"做的出,看的懂"的原则,效果展示、特性介绍、设计思路、代码实现、算法原理等多个方面的内容都有涉及,通过学习本系列文章,你将能够自己实现一个聊天机器人。 [mcwh2trz
本文为美团点评无人配送部技术团队主笔,为您带来的是自动驾驶中的激光雷达目标检测。(本文来源:美团无人配送)
李林 假装发自 威尼斯 量子位 出品 | 公众号 QbitAI 又一次!中国团队拿下一项AI赛事的多个大奖! 8天的计算机视觉顶会ICCV 2017在威尼斯悄然落幕,期间中国团队在物体检测、人体关键点检测等竞争激烈的比赛中击败了谷歌、微软、Facebook等国际巨头AI实验室。 ICCV 2017 “Joint COCO and Places Recognition Challenge” Workshop中,一共公布了7项竞赛的结果。 中国AI创业公司旷视科技(Face++)在MS COCO物体检测、人体关
YOLO9000 使用 YOLOv2 模型,采用联合训练算法训练,拥有9000类的分类信息。
本文报告介绍了深度学习在物体检测方面的最新进展,以及研究团队最近的几项研究工作,同时对深度学习在检测问题上的瓶颈和下一步突破进行了展望。
德国波恩大学StachnissLab最新工作,基于自监督学习的未来三维点云预测,被CoRL2021录用。论文及代码都已开源!
本文介绍物体检测技术以及解决此领域问题的几种不同方法,带你深入研究在Python中如何构建我们自己的对象检测系统。
源码:GitHub – matterport/Mask_RCNN: Mask R-CNN for object detection and instance segmentation on Keras and TensorFlow
传统的基于深度学习的目标检测方法需要大量的边界框标注数据进行训练,获得如此高质量的标注数据成本很高。少样本目标检测,学习适应只有少数带注释的例子的新类,非常具有挑战性,因为新目标的细粒度特征很容易被忽略,而只有少数可用数据。
AI 科技评论按:物体检测是计算机视觉的基础任务之一。香港中文大学多媒体实验室博士生陈恺在 AI 研习社的公开课上,为大家总结了深度学习背景下物体检测算法的发展,分享 COCO 比赛冠军团队所使用的算法,并介绍由港中大多媒体实验室开源的物体检测算法框架 mmdetection。
MSRA 视觉组 作者:胡瀚、顾家远、张拯、代季峰、危夷晨 现有的物体检测算法均采用单独识别物体的方式,而没有利用物体之间的相互关系。近日,来自微软亚洲研究院视觉计算组的研究员们提出了物体关系模块(object relation module)。该模块通过建模物体间外观和几何的交互信息来首次实现了所有物体的联合推理学习。该模块可以用于提高物体识别的精度,也可以替代通常使用的非极大抑制(non-maximum suppression)后处理方法。在现今最好的物体检测框架下,利用该模块实现了首个完全端到端的物体
来源:PaperWeekly 本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。 -01- Face Recognition #世界上最简单的人脸识别库
来源:PaperWeekly 本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。 -01- Face Recognition #世界上最简单的人脸识别库 本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。 项目链接: https://github.com/agei
摘 要:本文针对物体检测中的环境变化多样、物体尺度变化不一、搜索空间巨大等挑战性问题,围绕特征构建、模型优化和应用等方面进行研究。针对物体检测中的多尺度特征融合问题,提出针对物体检测的神经网络特征融合方法HyperNet;进一步提出了逆向连接的特征金字塔物体检测方法,将不同尺度的物体分配不同层次的特征,该方法大大减少了多尺度物体检测的难度;提出了无需候选窗的物体检测模型FoveaBox,摒弃了传统依赖候选窗扫描的过程。本文提出的系列方法已经在检测、分割、姿态估计等方面成功得到拓展。
深度学习是如今最火热的技术之一,但是对于有心入门却不得其法的同学来说,选择适合自己的书籍至关重要。 本着乐于助人、无私奉献的精神,小编特意为大家精选了 10本深度学习相关的书籍。这些书籍中,有些非常注重理论知识,主要关注神经网络和深度学习背后的数学和相关假设;有些则注重实战,通过代码而不是理论来讲解深度学习。而那种既有理论讲解,同时又有相应的实战训练的书籍。 本次电子书籍为CSDN回馈粉丝福利免费赠送,所有书籍均可在CSDN上在线学习(文末获取学习地址)。 现在,让我们一览这些书籍,比较优劣,看看哪些对于学
【导读】9 月 8 日-14 日,每两年举办一次的 2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,本次会议总共收到了 2439 篇有效的论文,相比上一届 2016年会议增加了 65% ,其中有 776 篇被接受( 31.8 % )。可以说,今年是国内各高校、企业研究机构收获丰富的一年,无论是过去的 CVPR、ICCV 大会,都是华人的成果占据半壁江山,可见国内计算机视觉这两年来的迅猛的发展。
计算机视觉研究院专栏 作者:Edison_G 目标检测现在的框架越来越多,我们“计算机视觉研究院”最近也分享了众多的目标检测框架!今天我们继续分享一个最新的检测框架——YOLOR。 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文:https://arxiv.org/pdf/2103.17115.pdf 开源代码: https://github.com/hzhupku/DCNet 1 前言 传统的基于深度学习的目标检测方法需要大量的边界框标注数据进行训练,获得
AI 科技评论:港中文最新论文研究表明目前的深度神经网络即使在人工标注的标准数据库中训练(例如 ImageNet),性能也会出现剧烈波动。这种情况在使用少批量数据更新神经网络的参数时更为严重。研究发现这是由于 BN(Batch Normalization)导致的。BN 是 Google 在 2015 年提出的归一化方法。至今已有 5000+次引用,在学术界和工业界均被广泛使用。港中文团队提出的 SN(Switchable Normalization)解决了 BN 的不足。SN 在 ImageNet 大规模图像识别数据集和 Microsoft COCO 大规模物体检测数据集的准确率,还超过了最近由 Facebook 何恺明等人提出的组归一化 GN(Group Normalization)。原论文请参考 arXiv:1806.10779 和代码 https://github.com/switchablenorms
本文适合刚入门物体检测的人群学习,不涉及公式推理。 目录 *摘要 *相关物体检测数据集介绍 *现有的主流物体检测算法 *物体检测的难点与挑战 *相关术语介绍 *物体检测的传统算法概述 *基于深度学习的物体检测算法 R-CNN Fast-RCNN Faster-RCNN YOLO *物体检测动手实践 *参考文献 摘要 相比于图像分类,图像中物体检测是计算机视觉中一个更加复杂的问题,因为图像分类只需要判断出图像属于哪一类就行,而在物体检测中,图像里可能有多个物体,我们需要对所有
本文来谈一下基于深度学习的航空物体场景下的物体检测。航空物体这类场景一般由无人机空拍来收集数据,然后进行后处理来满足特定的任务场景,有些情况下要求实现实时反馈,甚至多任务。
雷锋网 AI 科技评论按:本文作者 Priyanka Kochhar 从事数据科学十多年,现在在运营一家深度学习咨询公司,她曾帮助多家创业公司完成人工智能解决方案的计划和部署,如果有兴趣与她合作,请联系 priya.toronto3@gmail.com。 最近,TensorFlow 的「物体检测 API」有了一个新功能,它能根据目标对象的像素位置来确定该对象的像素。换句话来说,TensorFlow 的物体检测从原来的图像级别成功上升到了像素级别。 使用 TensorFlow 的「物体检测 API」图片中的物
领取专属 10元无门槛券
手把手带您无忧上云