论文名称: A survey of image semantics-based visual simultaneous localization and mapping Application-oriented solutions to autonomous navigation of mobile robots 作者: Linlin Xia, Jiashuo Cui, Ran Shen, Xun Xu, Yiping Gao and Xinying Li
之前做的深度学习闭环检测 这方面,最近想了解下语义这方面,于是总结了一些开源的语义SLAM代码共后面研究:
来源丨https://zhuanlan.zhihu.com/p/379243930
标题:Visual Semantic SLAM with Landmarks for Large-Scale Outdoor Environment
文章:SD-SLAM: A Semantic SLAM Approach for Dynamic Scenes Based on LiDAR Point Clouds
虽然直接法SLAM在无纹理环境更加鲁棒,但是由于灰度图像的凸性特征导致光度误差的凸性仅在一个小区域内保持的问题,所以传统的直接法视觉SLAM在当跟踪点有较大位移时,可能陷入次优局部极小解,具体问题描述如下图,左边分别是对应区域的灰度图和语义概率图,右图相应的三维可视化,灰度图像保留了对象的细节,而道路的概率主要在道路边界上进行生成,对于语义对象边界上的点,语义概率的凸性在比灰度图像更大的区域中成立。
文章:Semantic Visual Simultaneous Localization and Mapping: A Survey
代码:https://github.com/USTCLH/OCC-VO.git (coming soon)
论文地址: http://arxiv.org/pdf/1809.08379v2.pdf
标题:Semantic SLAM Based on Improvement DeepLabv3+ in Dynamic Scenarios
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
对象级数据关联和姿态估计在语义SLAM中起着重要作用,但由于缺乏鲁棒和精确的算法,这一问题一直没有得到解决.在这项工作中,我们提出了一个集成参数和非参数统计检验的集成数据关联策略.通过利用不同统计的性质,我们的方法可以有效地聚集不同测量的信息,从而显著提高数据关联的鲁棒性和准确性.然后我们提出了一个精确的目标姿态估计框架,并且开发了outliers-robust centroid、尺度估计算法和对象姿态初始化算法来帮助提高姿态估计结果的最优性,以帮助提高姿态估计结果的最优性.此外我们建立了一个SLAM系统,可以用单目相机生成半稠密或轻量级的面向对象.地图在三个公开可用的数据集和一个真实场景上进行了大量实验,结果表明,我们的方法在准确性和鲁棒性方面明显优于最先进的技术.
VIW Fusion是一种基于优化的视觉+惯导+轮速的里程计方案,感谢由港科大空中机器人小组在VINS Fusion方面所做的杰出工作,VIW融合是在VINS融合的基础上发展起来的。主要特征有:
同步定位和制图(SLAM)一直被认为机器人定位导航以及无人驾驶的核心技术,而利用摄像头作为传感器的视觉SLAM在近几十年也得到了广泛的研究,在这期间涌现了大量优秀的SLAM方法,为后人对SLAM技术的研究打下了坚实的基础。
----大家好,我是旷视研究院SLAM组负责人刘骁,很高兴能和大家分享机器人领域一些有关三维视觉技术的思考。
Kimera是C++实现的一个具有实时度量的语义SLAM系统,使用的传感器有相机与IMU惯导数据来构建环境语义标注的3D网格,Kimera支持ROS运行在CPU上的高效模块化的开源方案。包含了四个模块:
文章:SLAM and 3D Semantic Reconstruction Based on the Fusion of Lidar and Monocular Vision
文章:Hybrid Bird’s-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking
文章:Multi-LiDAR Localization and Mapping Pipeline for Urban Autonomous Driving
文章:Monocular Object and Plane SLAM in Structured Environments
SLAM算法是移动机器人实现自主移动的关键环节。激光雷达(LiDAR)具有测距精度高、不易受外部干扰和地图构建直观方便等优点,广泛应用于大型复杂室内外场景地图的构建。随着3D激光器的应用与普及,国内外学者围绕基于3D激光雷达的SLAM算法的研究已取得丰硕的成果。
目前 Semantic SLAM (注意不是 Semantic Mapping)工作还比较初步,可能很多思路还没有打开,但可以预见未来几年工作会越来越多。语义 SLAM 的难点在于怎样设计误差函数,将 Deep Learning 的检测或者分割结果作为一个观测,融入 SLAM 的优化问题中一起联合优化,同时还要尽可能做到至少 GPU 实时。
视觉SLAM的稳定性是一项技术挑战。因为基于单目的视觉SLAM需要初始化、尺度的不确定性和尺度漂移等问题[1]。尽管立体相机和RGB-D相机可以解决初始化和缩放的问题,但也存在一些不容忽视的问题,如运动速度快、视角小、计算量大、遮挡、特征丢失、动态场景和光照变换等。针对以上这些问题传感器的融合方案逐渐流行起来,IMU与相机融合的视觉里程计成为研究热点。
上一届国际计算机视觉大会ICCV,成为了深度学习技术的主场,但在我们宣布卷积神经网络的全面胜利之前,让我们先看看计算机视觉的,非学习几何方面的进展如何。同步定位与地图构建可以说是机器人学领域最重要的算法之一,在计算机视觉和机器人研究社区完成了一些开创性的工作。本文将总结来自 ICCV 实时 SLAM 的未来研讨会的要点。
文章:AVM-SLAM: Semantic Visual SLAM with Multi-Sensor Fusion in a Bird’s Eye View for Automated Valet Parking
EAO-SLAM: Monocular Semi-Dense Object SLAM Based on Ensemble Data Association
文章:OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception
文章:SA-LOAM: Semantic-aided LiDAR SLAM with Loop Closure
文章:Monocular Simultaneous Localization and Mapping using Ground Textures
文章:SAGE-ICP: Semantic Information-Assisted ICP
摘要:近年来,基于视觉传感器在同时定位与地图构建(SLAM)系统中展示出了显著的性能、准确性和效率。在这里,视觉同时定位与地图构建(VSLAM)方法是指使用相机进行姿态估计和地图生成的SLAM方法。
RGB-D相机作为一种特殊形式的相机,主要通过主动发射红外结构光或计算飞行时间(TOF)来直接获得图像深度。它使用方便,但对光线敏感,大多数情况下只能在室内使用。
3D视觉工坊致力于推荐最棒的工作机会,精准地为其找到最佳求职者,做连接优质企业和优质人才的桥梁。如果你需要我们帮助你发布实习或全职岗位,请添加微信号「CV_LAB」。
文章:Robust Intrinsic and Extrinsic Calibration of RGB-D Cameras
摘要:本综述涵盖了深度学习技术应用到SLAM领域的最新研究成果,重点介绍和总结了深度学习在前端跟踪、后端优化、语义建图和不确定性估计中的研究成果,展望了深度学习下视觉SLAM的发展趋势,为后继者了解与应用深度学习技术、研究移动机器人自主定位和建图问题的可行性方案提供助力。
文章;LESS-Map: Lightweight and Evolving Semantic Map in Parking Lots for Long-term Self-Localization
论文地址: https://arxiv.org/pdf/2001.01028.pdf
文章:LOG-LIO: A LiDAR-Inertial Odometry with Efficient Local Geometric Information Estimation
文章:SemanticSLAM: Learning based Semantic Map Construction and Robust Camera Localization
上周花了半天时间在Windows下安装pytorch库,这里记录了参考博客和踩坑过程,我也不知道我能坚持多久,但我想通过记录的方式让这个过程更有趣,更有意义,期待朋友们的一起分享,理论课程固然重要,但实践出真知,所以还是先配置环境,并运行一些实例激发我们的兴趣吧!
作者提出了一种语义平面 SLAM 系统,该系统使用来自实例平面分割网络的线索来改进位姿估计和映射。虽然主流方法是使用 RGB-D 传感器,但在这样的系统中使用单目相机仍然面临着鲁棒的数据关联和精确的几何模型拟合等诸多挑战。在大多数现有工作中,几何模型估计问题,例如单应性估计和分段平面重建(piece-wise planar reconstruction,PPR),通常由标准(贪婪)RANSAC解决。然而,在缺乏场景信息(即尺度)的情况下,设置RANSAC的阈值是很非常困难的。在这项工作中,作者认为可以通过最小化涉及空间相干性的能量函数来解决两个提到的几何模型(单应性/3D平面),即图割优化,这也解决了经过训练的CNN的输出是不准确的问题。此外,作者根据实验提出了一种自适应参数设置策略,并完成了对各种开源数据集的综合评估。
论文标题:NID-SLAM: NEURAL IMPLICIT REPRESENTATION-BASED RGB-D SLAM IN DYNAMIC ENVIRONMENTS
文章:Multi-Camera Visual-Inertial Simultaneous Localization and Mapping for Autonomous Valet Parking
作者:Ziwei Liao, Yutong Hu, Jiadong Zhang, Xianyu Qi, Xiaoyu Zhang, Wei Wang*
现有的视觉SLAM一般假定环境是刚性的,这种假设很大程度上限制了算法的应用,因为现实环境是动态变化的(汽车,行人等)。现有的解决方法一是通过动态物体去除来缓解这个问题,但是随着动态物体点占比的提升,直接采取去除的方式会大大降低定位的精度;二是利用深度学习来标注动态物体从而来维持静态环境的假设,但是这样会导致环境信息的丢失;三是基于语义来同时解决SLAM和目标跟踪问题,这也是这篇文章的技术基础之一。
文章:Intensity Scan Context: Coding Intensity and Geometry Relations for Loop Closure Detection
领取专属 10元无门槛券
手把手带您无忧上云