Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NeRFs和3D高斯溅射技术如何重塑SLAM:综述

NeRFs和3D高斯溅射技术如何重塑SLAM:综述

作者头像
点云PCL博主
发布于 2024-06-21 05:02:02
发布于 2024-06-21 05:02:02
1.7K0
举报
文章被收录于专栏:点云PCL点云PCL

文章:How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey

作者:Fabio Tosi,Youmin Zhang,Ziren Gong,Erik Sandstrom ,Matteo Poggi,Stefano Mattoccia,Martin R. Oswald

编辑:点云PCL

公众号致力于点云处理,SLAM,三维视觉,高精地图等领域相关内容的干货分享,欢迎各位加入,有兴趣的可联系dianyunpcl@163.com。文章未申请原创侵权或转载联系微信cloudpoint9527。

摘要

在过去的二十年中,同时定位与地图构建(SLAM)领域的研究经历了显著的演变,凸显了其在实现未知环境自主探索方面的关键作用。这一演变涵盖了从手工方法,通过深度学习时代,再到最近聚焦于神经辐射场(NeRFs)和3D高斯点(3DGS)表示的最新发展。鉴于这一领域日益增长的研究和缺乏综合性的综述,本文旨在通过最新辐射场技术的发展视角,提供SLAM进展的首个全面概述。本文阐述了SLAM的背景、进化路径、固有优势和局限性,并作为一份基础性参考,突出了该领域的动态进展和具体挑战。

图1:SLAM演变时间轴。此时间轴首先展示了从手工方法向深度学习技术的过渡,并列出了这两个时代的关键综述。2021年,一个关键的转变集中在基于辐射场的SLAM系统,以iMap [1] 为标志。图中右侧的圆圈代表每年的关键论文,圆圈的大小表示发表量。2024年的外圈预示着一个预期的激增,突显了对NeRF和3DGS启发的SLAM日益增长的兴趣。

主要贡献

1. 首次对SLAM的发展进行了广泛的综述,特别关注了受NeRF和3DGS启发的方法。

2. 历史背景和演变:提供了从手工制作方法到当前最先进方法的详细时间表。

3. 深入分析:对73个当代SLAM系统进行了深入调查,分类并分析其方法论。

4. 未来方向:突出当前方法的局限性并提出未来研究方向以克服这些挑战。

内容概述

SLAM技术的演变

SLAM技术的早期发展主要依赖于人工设计的算法,利用声纳、LiDAR等传感器进行环境感知和地图构建。这些方法虽然在实时性和可扩展性方面表现出色,但在动态环境和纹理较差的场景中往往表现不佳。随着深度学习的兴起,SLAM技术迎来了新的机遇。深度学习通过其强大的特征提取能力,提高了定位和地图构建的精度。尽管如此,这些方法依赖于大量的训练数据,并且在处理未见过的场景时仍面临挑战。神经辐射场(NeRFs)和3D高斯点技术(3DGS)代表了SLAM研究的最新前沿。这些方法通过连续的表面建模和减少的内存需求,实现了更高效的环境感知和地图构建。NeRFs和3DGS不仅能够处理噪声和遮挡,还能生成高分辨率的3D网格,显著提升了SLAM系统的性能。

图3:NeRF和3DGS在概念上有所不同。(左)NeRF沿着射线查询多层感知器(MLP),而(右)3DGS则为给定的射线混合高斯分布。

NeRF和3DGS在SLAM中的应用

NeRFs是一种基于神经网络的3D表示方法,通过从多个视角学习场景的辐射场,能够生成高质量的3D重建。NeRFs在处理复杂几何形状和高细节场景方面表现出色,为SLAM系统提供了更精确的环境感知能力。3DGS通过在3D空间中使用高斯分布表示点云,实现了更高效的地图构建和更新。3DGS不仅减少了内存需求,还改进了噪声处理和遮挡处理,使得SLAM系统在动态和复杂环境中表现更加稳定。

数据集

本节总结了最近SLAM方法中常用的数据集,涵盖了传感器、真值精度及其他关键因素等多个属性,适用于室内和室外环境。图4展示了来自不同数据集的定性示例,这些数据集将在后续部分进行介绍。

图4:主要SLAM数据集的定性比较。RGB-D图像来自:(a) ETH3D-SLAM,(b) ScanNet ,(c) TUM RGB-D,和(d) Replica。

同时定位与地图构建(SLAM)

这里介绍利用最新的辐射场表示进展的SLAM系统。按照基于方法的分类法组织,这些论文根据其方法进行分类,为读者提供清晰有序的呈现。该部分从基本分类开始,将论文分为RGB-D、RGB和LiDAR方法论,为特定子类别的发展奠定基础。每个类别列出了按照发布日期在会议/期刊上正式发表的论文,然后按照初稿提交日期在arXiv上发布的论文进行排列。为了全面理解,表1提供了受调查方法的详细概述。将不同的方法分为主要的RGB-D、RGB和基于LiDAR的框架。

图5:iMap的概述,这是神经隐式SLAM中的开创性方法。(左)图示了两个并发进程:跟踪,在锁定网络内优化当前帧的姿态;地图构建,在共同优化网络和所选关键帧的相机姿态。(右)利用可微渲染函数共同优化关键帧的场景网络参数和相机姿态。

图6:GS-SLAM的概述。该框架利用3D高斯场景表示和渲染的RGB-D图像进行逆相机跟踪。通过一种新颖的高斯扩展策略,GS-SLAM在GPU上实现了实时跟踪、地图构建和渲染,增强了场景重建能力。

图7:3D高斯可视化。(左)光栅化的高斯分布,(右)着色的高斯分布以突出显示底层几何形状。

图8:子地图可视化。神经子地图沿着扫描轨迹逐步分配,以它们专用的局部坐标框架编码精确的场景几何形状和颜色。

图9:语义可视化。来自Replica数据集的两个场景的3D语义网格(底部)及其使用RGB颜色进行分解的可视化(顶部)

图10:DEV-Indoors数据集的概览。(a) 显示正常、运动模糊和暗场景的RGB图像,对应的(b) 事件流和(c) 地面真实网格。

图11:PIN-SLAM概览。顶部:(a) LiDAR扫描,(b) 隐式SDF,(c) 从SDF重建的网格。底部:(d) 基于点的隐式神经(PIN)地图的可视化。

图12:在ScanNet 数据集上的SLAM方法比较 - 表面重建和定位准确性。真值轨迹为蓝色,估计轨迹为橙色。平均轨迹误差(ATE)通过色条进行可视化。

图13:在Replica数据集上的SLAM方法比较 - 地图构建。

表2对TUM RGB-D数据集的三个场景进行了摄像机跟踪结果的彻底分析,这些场景具有稀疏的深度传感器信息和RGB图像中的高运动模糊等挑战性条件。关键的基准包括像Kintinuous、BAD-SLAM和ORB-SLAM2这样的已建立方法,代表了传统的人工基线。

表3展示了在ScanNet数据集的六个场景中摄像机跟踪方法的评估。在RGB-D领域,表现突出的有帧到帧模型MoD-SLAM和GO-SLAM。两者都利用了精心设计的视觉里程计(如DROID-SLAM)和闭环策略,GO-SLAM还结合了全局捆绑调整(Global BA)。

表4评估了Replica数据集中的八个场景的摄像机跟踪,使用了比ScanNet和TUM RGB-D等具有挑战性的对手更高质量的图像。评估包括每个单独场景的ATE RMSE结果报告以及平均结果。

在表5中,重点突出在Replica数据集上3D重建和2D深度估计方面的表现。通过对表格的检查,明显看到从iMap到最近的方法(如NID-SLAM和ADFP)在3D重建和2D深度估计指标上的显著进步。

表6显示了Replica训练输入视图上的渲染质量,采用了Point-SLAM和NICE-SLAM的标准评估方法。

表7展示了在Replica数据集上最先进的RGB-D语义SLAM方法的对比分析,使用mIoU指标评估输入视图的语义分割性能,遵循SemGauss-SLAM的评估协议。比较的方法包括NIDS-SLAM、DNS SLAM、SNI-SLAM、NEDS-SLAM 和SemGauss-SLAM。表格突出了某些方法使用外部先验来提高其语义理解能力。在比较的方法中,SemGauss-SLAM在Replica数据集的所有八个场景中都获得了最高的mIoU分数,展示了其在语义分割方面的卓越性能。

表8评估了在KITTI数据集上LiDAR SLAM策略的表现,详细说明了顶部的里程计准确性和底部的SLAM性能指标。里程计部分报告了平均相对平移漂移误差(%),并突出了禁用闭环检测修正和位姿图优化模块的PIN-SLAM变体PIN-LO的表现。PIN-LO在使用不同地图表示(特征点、更稠密的体素降采样点、正态分布变换、表面元素和三角网格)的多个LiDAR里程计系统中表现优异,实现了0.5%的出色平移误差,与KISS-ICP和CT-ICP竞争,并由于改进的SDF训练和鲁棒的点到SDF配准,超越了神经隐式方法Nerf-LOAM。

表9报告了Newer College数据集上的跟踪准确性,以ATE RMSE [cm]衡量,观察到PIN-SLAM在全序列集上的平均RMSE为0.19 cm,比PIN-LO低5倍,这进一步确认了PIN-SLAM在全局轨迹跟踪方面的优越性。

表10汇总了New College数据集上3D重建质量的结果—特别是在Quad和Math Institute序列上,使用Accuracy和Completeness得分来评估Nerf-LOAM和PIN-SLAM的有效性,后者再次确认在该数据集上评估的所有LiDAR SLAM系统中表现最佳。特别是在Quad上,我们可以看到PIN-SLAM和Nerf-LOAM之间在Completeness方面的显著差距—约7 cm。

表11汇总了在Replica上运行的RGB-D和RGB系统的基准测试结果,按平均FPS升序排列。首先,我们考虑RGB-D框架:尽管SplaTAM在渲染图像方面效率很高,但在同时处理跟踪和建图时速度却慢得多。混合方法使用分层特征网格也有类似的情况,但需要的GPU内存却少得多—比SplaTAM少4到5倍。最后,使用更高级的表示可以实现更快的处理。这在RGB-only方法的研究中得到了证实,中间部分显示NeRF-SLAM比DIM-SLAM快6倍。最后,关于LiDAR SLAM系统,我们可以看到PIN-SLAM比Nerf-LOAM更高效,仅需要7 GB的GPU内存,同时运行速度接近7 FPS,而Nerf-LOAM需要接近12 GB和每帧4秒。

讨论

场景表示

场景表示的选择在当前SLAM解决方案中至关重要,对建图/跟踪精度、渲染质量和计算能力有显著影响。早期方法如iMAP使用基于网络的方法,通过基于坐标的多层感知器(MLP)隐式建模场景。尽管这些方法提供了紧凑、连续的场景建模,但由于更新局部区域和扩展大场景的挑战,它们难以实现实时重建,且往往生成过于平滑的场景重建。后续研究探索了基于网格的表示,例如多分辨率分层和稀疏八叉树网格,这些表示方法因快速的邻居查找而受欢迎,但需要预先指定网格分辨率,导致在空旷空间中内存使用效率低下,且捕捉细节的能力受分辨率限制。最近的进展如Point-SLAM和Loopy-SLAM倾向于混合神经点表示。与网格不同,点密度自然变化,无需预先指定。点集中在表面周围并对细节分配更高密度,相比于基于网络的方法更易于扩展和局部更新。目前,基于点的方法在3D重建中表现优异,在Replica数据集上的实验表明其能生成高度准确的3D表面。然而,与其他NeRF风格的方法类似,体积射线采样显著限制了其效率。有前景的技术包括基于3D高斯散射(3D Gaussian Splatting,3DGS)范式的显式表示。基于3DGS的显式表示在实现最先进的渲染精度的同时,也展示了更快的渲染速度。然而,这些方法存在诸多限制,包括对初始化的严重依赖以及在未观察区域中的原语增长控制缺失。此外,原始3DGS场景表示需要大量3D高斯原语以实现高保真重建,导致显著的内存消耗。尽管在过去三年中取得了显著进展,研究仍在积极克服现有场景表示的局限性,并寻找更有效的替代方案以提高SLAM的精度和实时性能。

历史信息的遗忘

现有方法往往在大场景或长视频序列中表现出遗忘之前学习的信息的趋势。对于基于网络的方法,这归因于它们依赖于单个神经网络或具有固定容量的全局模型,在优化过程中受到全局变化的影响。常见的方法是使用当前观测的稀疏射线采样训练网络,同时重放历史数据中的关键帧。然而,在大规模增量建图中,这种策略导致数据累积增加,需要复杂的重新采样程序以提高内存效率。遗忘问题也扩展到基于网格的方法。尽管努力解决这一问题,由于二次或立方空间复杂性,仍然面临扩展性挑战。虽然显式表示如3DGS风格解决方案提供了灾难性遗忘的实际解决方案,但由于内存需求增加和处理速度慢,尤其是在大场景中面临挑战。一些方法尝试通过稀疏帧采样来缓解这些限制,但这导致了3D空间中信息采样效率低下,导致模型更新速度较慢且不均匀,相比于整合稀疏射线采样的方法。最终,一些策略建议将环境划分为子图,并将局部SLAM任务分配给不同的代理。然而,这引入了处理多个分布式模型和制定有效策略以管理重叠区域并防止地图融合伪影的新挑战。

实时约束

许多技术在实现实时处理方面面临挑战,往往无法达到传感器的帧率。这一限制主要归因于所选择的地图数据结构或计算密集型基于射线渲染的优化,尤其在NeRF风格的SLAM方法中尤为明显。特别是使用分层网格的混合方法需要更少的GPU内存,但运行速度较慢。另一方面,先进的表示如哈希网格或稀疏体素允许更快的计算,但需要更高的内存需求。尽管如此,当前的3DGS风格方法在快速图像渲染方面具有优势,但仍难以有效处理同时进行的跟踪和建图处理,限制了其在实时应用中的有效使用。

全局优化

实现闭环和全局捆绑调整需要显著的计算资源,特别是在实时应用中存在性能瓶颈的风险。许多审查的帧到模型方法在闭环和全局捆绑调整方面面临挑战,因为更新整个3D模型的计算复杂性非常高。相比之下,帧到帧技术通过在后台线程中执行全局捆绑调整来促进全局校正,这显著提高了跟踪精度,如报告的实验所示,但相比实时速度较慢。对于这两种方法,由于潜在特征网格缺乏灵活性以适应闭环校正的位姿校正,计算成本大大增加。实际上,这需要在校正闭环并更新位姿后重新分配特征网格并重新训练整个地图。然而,随着处理的帧数增加,这一挑战变得更加明显,导致相机漂移误差的累积,最终导致不一致的3D重建或重建过程的快速崩溃。总体而言,将建图和跟踪过程分开,往往比耦合方法实现更好的跟踪性能。通过允许跟踪模块专注于相机位姿估计而不需要同时更新地图表示的复杂性,分离方法可以实现更准确和更稳健的跟踪。然而,这种改进的精度和稳健性以增加的计算开销为代价,因为独立的建图和跟踪阶段需要单独的处理流程和内存分配,这可能影响SLAM系统的整体效率。

NeRF与3DGS在SLAM中的比较

NeRF风格的SLAM主要依赖于MLP,适用于新视图合成、建图和跟踪,但面临诸如过度平滑、历史信息遗忘和由于依赖于逐像素射线行进而导致的计算效率低下等挑战。3DGS绕过了逐像素射线行进,通过基于原语的可微光栅化利用稀疏性。这为SLAM提供了显式体积表示、快速渲染、丰富的优化、直接的梯度流动、增加的地图容量和显式的空间范围控制。尽管NeRF在合成新视图方面表现出色,其缓慢的训练速度和难以适应SLAM是显著的缺点。3DGS以其高效的渲染、显式表示和丰富的优化能力,成为一个强大的替代方案。尽管如此,当前的3DGS风格SLAM方法也存在一些限制,包括大场景的可扩展性问题、缺乏直接的网格提取算法、无法准确编码精确的几何形状等。此外,3DGS风格SLAM系统的计算复杂性显著高于NeRF方法,这可能阻碍实时性能和实际部署,尤其是在资源受限的设备上。为了缓解这些问题,最近的研究如Compact-GSSLAM,集中于开发紧凑的3D高斯场景表示,以优化存储效率,同时保持高质量重建、快速训练收敛和实时渲染能力。

总结

总而言之,本综述开创性地探索了受辐射场表示最新进展影响的SLAM方法。从开创性的iMap到最新进展,回顾了仅在三年内涌现的大量文献。通过结构化的分类和分析,突出显示了关键的局限性和创新,提供了在跟踪、建图和渲染方面的比较结果和宝贵见解。同时它还识别了当前的开放挑战,为未来的研究提供了有趣的探索方向。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 点云PCL 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
工业视觉中如何定量分析镜头光学性能
光学传递函数(OTF)包括调制传递函数(MTF)和相位传递函数(PTF)两部分,其中MTF代表物像频谱对比度之比,表明各种频率传递情况,PTF代表目标物经过光学系统成像后相位的变化。
苏州程序大白
2021/08/13
1.7K0
工业视觉中如何定量分析镜头光学性能
光学成像 |综述| 高光谱成像技术概述
在经典物理学中,光波穿过狭缝、小孔或者圆盘之类的障碍物时,不同波长的光会发生不同程度的弯散传播,再通过光栅进行衍射分光,形成一条条谱带。也就是说:空间中的一维信息通过镜头和狭缝后,不同波长的光按照不同程度的弯散传播,这一维图像上的每个点,再通过光栅进行衍射分光,形成一个谱带,照射到探测器上,探测器上的每个像素位置和强度表征光谱和强度。一个点对应一个谱段,一条线就对应一个谱面,因此探测器每次成像是空间一条线上的光谱信息,为了获得空间二维图像再通过机械推扫,完成整个平面的图像和光谱数据采集。
小白学视觉
2021/08/06
1.8K0
机器视觉(第3期)----图像采集之镜头原理详述
上期我们一起学习了光源相关的知识,知道了怎么选择光源,链接如下: 机器视觉(第2期)----图像采集之照明综述 镜头是一种光学设备,用于聚集光线在摄像机内部成像。镜头的作用是产生锐利的图像,以得到被测物的细节,这一期我们将一起学习使用不同镜头产生不同的成像几何,以及镜头像差是如何产生的。希望通过本期学习,我们能够掌握如何选择镜头以及像差产生的原因。 作为一个机器视觉算法人员,来介绍光学系统方面的知识,有些地方理解起来还是有些难度的,小编已经再旁边放了几摞砖,欢迎大家来拍。希望能够和大家一起交流,共同进步。
智能算法
2018/04/03
3.3K0
机器视觉(第3期)----图像采集之镜头原理详述
什么是傅里叶变换?傅里叶变换处理图像的原理是什么?
傅里叶变换,最牛的算法之一,广泛应用于物理学、信号处理、概率、统计、密码学、声学、光学等领域。
微帧Visionular
2024/11/08
6950
什么是傅里叶变换?傅里叶变换处理图像的原理是什么?
偏振成像的基本原理和特点
通过空间校正,线扫描偏振相机可以探测到双折射、应力、表面粗糙度以及常规成像无法检测到的物理特性。 光有三个基本特性:强度、波长和偏振.今天几乎所有的相机都是为单色或彩色成像而设计的。单色相机用于测量在像素级宽带光谱上的光强,而彩色或多光谱相机则用于检测红、绿、蓝和近红外波段的光强。同样,偏振照相机用于在多偏振状态下捕捉光的强度。
小白学视觉
2021/12/13
4.3K0
偏振成像的基本原理和特点
工业相机在全息成像中的应用
对透明物体成像作为一种独特的技术,广泛应用于生物学、医学、工业机器视觉等领域,其中特殊涂层、样本染色、相位成像、结构光和多光谱成像等,都是透明物体成像技术的一种。然而,发展透明物体成像技术,在许多领域都面临挑战。
小白学视觉
2022/09/28
4590
工业相机在全息成像中的应用
三种超精密光学结构表面形貌测量方法
共聚焦显微扫描技术发展于上世纪80 年代,其测量原理如图所示,激光由光源发出,经分光镜和显微物镜投射在待测品表面上,待测品表面反射回的光束沿着光路结构到达共聚焦针孔滤光片。此时,只有在待测品的表面刚好处于聚焦平面时,反射光才能穿过共聚焦针孔滤光片,被光强倍增管感应到,否则,当待测品表面处于离焦的位置时,反射光会被滤光片吸收。测量物体时,PZT 驱动物镜改变物距,调节待测品表面与焦平面的距离,越靠近焦平面,光电倍增管感应到的光信号越强。当光信号感应到达峰值时,表示待测品表面到达焦平面位置,投射在测量表面上的激光汇聚成一点,根据仪器与该测量点的数学关系可以计算该点的高度信息。对待测品上的各个点依次测量,就可以获求取待测品的整个形貌高度。
睐芯科技LightSense
2024/07/24
2910
数字图像处理学习笔记(十二)——频率域滤波
滤波器:抑制或最小化某些频率的波和震荡的装置或材料 低通滤波器抑制或最小化高频率的波 高通滤波器抑制或最小化低频率的波 频率:自变量单位变化期间内,一个周期函数重复相同值序列的次数
荣仔_最靓的仔
2021/02/02
2.9K0
数字图像处理学习笔记(十二)——频率域滤波
Computer Graphics note(3):视图变换 & 光栅化
M变换:https://blog.csdn.net/Enterprise_/article/details/106880754 VP变换:https://blog.csdn.net/Enterprise_/article/details/106934622
Enterprise_
2020/06/29
9570
Computer Graphics note(3):视图变换 & 光栅化
【笔记】《计算机图形学》(9)——信号处理
这系列的笔记来自著名的图形学虎书《Fundamentals of Computer Graphics》,这里我为了保证与最新的技术接轨看的是英文第五版,而没有选择第二版的中文翻译版本。不过在记笔记时多少也会参考一下中文版本
ZifengHuang
2020/09/15
2.8K0
【笔记】《计算机图形学》(9)——信号处理
Computer Graphics note(3):视口变换&光栅化
Games101 Lecture5-6-7 在M(模型)V(视图)P(投影)变换之后,得到[−1,1]3[-1,1]^3[−1,1]3,接下来就是将其映射到屏幕空间上去。 M变换:https://blog.csdn.net/Enterprise_/article/details/106880754 VP变换:https://blog.csdn.net/Enterprise_/article/details/106934622
Enterprise_
2020/08/02
1.2K0
机器视觉检测系统中这些参数你都知道么?
摄像机是机器视觉系统中的一个关键组件,其最本质的功能就是将光信号转变成为有序的电信号。选择合适的摄像机也是机器视觉系统设计中的重要环节,摄像机的不仅是直接决定所采集到的图像分辨率、图像质量等,同时也与整个系统的运行模式直接相关。
小白学视觉
2019/06/19
3.1K0
机器视觉检测系统中这些参数你都知道么?
机器视觉工业缺陷检测(光源,相机,镜头,算法)
视觉工业检测大体分为工件尺寸测量与定位,和表面缺陷检测,及各种Logo标识的检测与识别等。
机器学习AI算法工程
2021/10/14
18.6K0
机器视觉工业缺陷检测(光源,相机,镜头,算法)
3D成像方法 汇总(原理解析)— 双目视觉、激光三角、结构光、ToF、光场、全息
这里要介绍的是真正的3D成像,得到物体三维的图形,是立体的图像。而不是利用人眼视觉差异的特点,错误感知到的假三维信息。
3D视觉工坊
2021/05/18
4.8K0
3D成像方法 汇总(原理解析)— 双目视觉、激光三角、结构光、ToF、光场、全息
机器视觉镜头基础知识详解
镜头相当于充当晶状体这一环节,简而言之,镜头主要的作用就是聚光。为什么要聚光?比如说在大晴天用放大镜生火,你会发现阳光透过放大镜聚集到一点上,也就是说,想通过一块小面积的芯片去承载这么一片区域就不得不使用镜头聚焦。
小白学视觉
2020/08/13
1.7K0
Python图像处理:频域滤波降噪和图像增强
来源:DeepHub IMBA本文约4300字,建议阅读8分钟本文将讨论图像从FFT到逆FFT的频率变换所涉及的各个阶段,并结合FFT位移和逆FFT位移的使用。 图像处理已经成为我们日常生活中不可或缺的一部分,涉及到社交媒体和医学成像等各个领域。通过数码相机或卫星照片和医学扫描等其他来源获得的图像可能需要预处理以消除或增强噪声。频域滤波是一种可行的解决方案,它可以在增强图像锐化的同时消除噪声。 快速傅里叶变换(FFT)是一种将图像从空间域变换到频率域的数学技术,是图像处理中进行频率变换的关键工具。通过利用图
数据派THU
2023/04/08
1.1K0
Python图像处理:频域滤波降噪和图像增强
39. 消除失焦模糊的其他几种方法
这里面,编码光圈的优点是能同时获取到场景的全焦图像和相对粗糙的深度图,有了这个深度图,还可以实现像多视角成像这类功能。其缺点是由于编码光圈挡住了一部分光线,所以整体的亮度偏暗,信噪比也不够。而且由于不同物距的模糊核不一致,还需要进行提前的标定。
HawkWang
2020/04/17
1.6K0
39. 消除失焦模糊的其他几种方法
手机摄像头的小秘密
21世纪初,夏普与当时的日本通信运营商J-PHONE发明了夏普J-SH04,夏普J-SH04具有拍照功能。2003年4月24日夏普发售了全球首款百万像素手机J-SH53,风靡一时。
鲜枣课堂
2019/07/22
1.3K0
手机摄像头的小秘密
关于滤波和NCL的filwgts_lanczos函数
滤波的含义和应用就不再赘述,先理清楚几个概念:频谱就是频率的分布曲线,复杂振荡分解为振幅不同和频率不同的谐振荡,这些谐振荡的幅值按频率排列的图形叫做频谱。设一个能量信号为f(t),则它的频谱密度F(ω)可以由傅里叶变换求得。
郭好奇同学
2021/05/28
4.1K0
关于滤波和NCL的filwgts_lanczos函数
35. 去卷积:怎么把模糊的图像变清晰?
让我先从第一种镜头的缺陷导致的图像模糊讲起,因为这是所有的镜头都会存在的固有的问题。
HawkWang
2020/04/17
1.9K0
35. 去卷积:怎么把模糊的图像变清晰?
推荐阅读
相关推荐
工业视觉中如何定量分析镜头光学性能
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档