前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >三维点云数据压缩技术的最新趋势及在三维压缩域问题的挑战

三维点云数据压缩技术的最新趋势及在三维压缩域问题的挑战

作者头像
一点人工一点智能
发布于 2022-12-27 02:35:26
发布于 2022-12-27 02:35:26
1.1K0
举报

用于目标检测、跟踪和分割的3D点云数据的自动处理是人工智能和数据科学领域的最新研究趋势,旨在解决自动驾驶落地的不同问题并获得实时性能。

但是,以3D点云(使用激光雷达)形式产生的数据量非常巨大,所以研究人员正在研究新的数据压缩算法来处理由此产生的大量数据。然而,尽管压缩处理在克服空间需求方面具有优势,但是由于解压缩问题,这种处理增加了对计算资源的需求,代价更大。所以,考虑开发可以直接对压缩数据进行操作/分析而不涉及解压缩和再压缩阶段(需要多次,压缩数据需要被操作或分析)的算法将是具有创新性的。这个研究领域被称为压缩域处理。

在本文中,我们将快速介绍激光雷达生成的3D点云数据压缩领域的最新发展,并强调3D点云数据压缩域处理的未来挑战。

01 介绍

由于新冠肺炎的全球影响,世界正以比预期更快的速度走向数字化和自动化,以避免与受感染的人或物体发生任何肢体接触。自动驾驶(或无人驾驶)是一项新兴技术,学术界和工业界都做出了很多努力[1]。

激光雷达(光探测和测距)传感器主要用于车辆的自主导航,因为它们能以3D点云的形式保存周围物体的几何信息,便于了解周围信息。为支持这一领域,有大量的算法程序,如分割、检测、分类和跟踪正在被研发[1]。不过,在导航过程中3D点云虽然保留了环境的重要细节,但实时处理是却是另一个更大的挑战。为此,研究人员已经尝试了不同类型的算法(通过应用不同的2D变换,使用图形算法等)来减少3D点云数据的大小。其中,克服巨大数据量的一个重要的经典技术则是使用不同的数据压缩算法[1]。但是,我们知道,如果以压缩形式捕获/存储数据,为了便于进行对数据分析则需要先对压缩数据进行解压缩,然后进行处理。然而,如果要考虑实时性能,解压缩会变得代价巨大。为了解决这个问题,最近的热点则是考虑直接处理/操作压缩数据,而不进行数据的解压缩,这被称为压缩域处理(CDP) [2][3][4]。这种方法同时具备了计算和存储优势。并且如文献[2][3][4]所报道的,CDP技术已经在许多基于图像和视频的应用中获得成功。

所以,这里主要的问题是,能不能自动处理直接在3D压缩域(3DCD)压缩的3D点云数据?

本文旨在回顾一些最新的三维点云数据压缩技术,并提供一些关于对三维点云数据进行三维压缩域分析的挑战和可能性。图1是传统压缩域和3D点云压缩域的示意图。

图1 传统3D分析和未来预期的压缩域3D分析的典型流程图

02 近期三维点云数据压缩技术综述

这里将快速回顾三维点云数据压缩的最新研究。3D点云数据是由安装在自动驾驶汽车上的激光雷达设备采集的。为了进行各种类型的处理,还存在很多与激光雷达生成的数据相关联的挑战。不过,本节仅讨论压缩3D激光雷达点云数据的问题[5-14]。

研究人员在文献[5]中提出的核心思想是采用深度学习驱动的几何技术来压缩3D点云原始数据,使用分层结构自动编码器模型。其中所提出的模型是具有创新型的,并且与PointNet++有一些相似性。该模型使用编码器利用码字压缩点云原始数据,随后使用稀疏编码进一步压缩。在解码器的帮助下,完全按照相反的过程来解压缩数据,生成不同分辨率的模型。这种方法使用稀疏多尺度损失函数,并且获得了优于PCL和Draco的高压缩比。该模型通过ShapeNet40数据集测试,具有最优的重建质量。

在文献[6]中,研究人员提出了使用RNN和残差块来压缩3D点云数据的想法。该方法对压缩比和解压缩误差具有自适应性。这种方法是将激光雷达采集的原始3D点云数据转换为2D矩阵,然后进行预处理对数据进行归一化,然后进一步使用RNN进行压缩。如前所述,这种网络结构对于压缩是很好的,但是对于高度精确的解压缩,他们使用具有残余问题的解码器(不是在所有层中,而是仅在用于高速训练少数层中)。这篇文章中使用的性能指标是衡量压缩后数据大小的每个点的比特数(bpp ),以及估计解压缩后损失的对称最近邻均方根误差。这种方法的良好性能度量为其在机器人学等实际应用中的使用提供了巨大的潜力。

文献[7]提出了一种用于压缩和优化3D点云数据、保持几何信息的有损技术。它们使用区域生长技术进行分割,随后丢弃封闭表面内的所有点以实现压缩。之后,在解压缩期间,使用多项式方程来恢复丢弃的数据。简而言之,3D点云原始数据被分成不同的段,并且为每个段映射一个平面。而每个平面使用多项式方程进行建模。当使用高度结构化的数据进行测试时,该方法产生了良好的压缩比和RMSE。性能表现在压缩比为89%,RMSE值为0.003 RMSE,处理时间在0.0643毫秒的时间范围内。不过,该方法在处理复杂的点云数据时存在局限性。

文献[8]的综述论文概述了现有的3D点云压缩技术,解释了设计原理,并强调了它们的优缺点,讨论了文献中提出的不同方法,如1D遍历、基于2D的投影和映射方法、3D技术、基于八叉树的方法、LOD、聚类和变换表示等。不过,2D技术不适合应用在像是自动驾驶等需要高精度的场景中。因此,建议完全依赖3D方法,通过有损和无损3D点云压缩提供更好的精度。文献中还提到,非结构化点云数据的处理仍然是一个极具挑战的开放问题。文献[9]简要介绍了3D点云压缩中使用的基本技术,然后详细回顾了TMC1、TMC2和TMC3以及TMC13的编码器结构,最后分析了它们在不同情况下的失真性和复杂度。结果表明,对于密集点云,TMC2的平均性能最好,而对于稀疏和噪声点云,TMC13的时间复杂度较低。

文献[10]是关于压缩由陆地激光扫描仪(TLS)采集的数目和森林的非常密集的3D形态数据。由于以往的压缩方法效率低、耗时长,基于压缩感知的新想法突破了香农-奈奎斯特采样定理。本文采用压缩感知技术模拟阔叶树点云,并采用了体素和统计滤波对点云进行了简化、去除了孤点。之后,3D数据被直接分成三个1D数据,并且由于数据量大,1D也被安排成单独的矩阵。此外,还应用了稀疏变换,并且为了下采样,还使用了部分傅立叶矩阵。之后,为了精确地重建数据,则采用了ROMP(正则化正交匹配追踪)。这种压缩感知的优点在于,它在采样过程中完成压缩,(在传统算法中,压缩是在完成完全采样之后进行的)。该方法具有计算和存储优势。

最近,树结构被用于激光雷达数据压缩,并且树的深度与激光雷达数据的分辨率成正比。在该方法中,首先,点云输入之后会被分割变成一棵有八条“枝杈”的树,这个过程一直持续到指定的深度。之后,基于树的树结构熵模型用于进行熵编码,这进一步将树结构传递给压缩字节 [11]。该方法还尝试使用深度学习方法进行3D形状分割[12]。

Chenxi Tu [13]首次使用序列网络来压缩3D激光雷达数据。这里我们在工作中使用递归神经网络方法,将完整模型分为三个部分,(1)将行数据包数据转换为带有一些附加位的2D矩阵;(2)根据传感器规格将这些数据标准化;(3)将这些数据传递到基于RNN的编码器/解码器网络中。在解压缩端,首先将压缩数据传入RNN解码器网络,然后重新排列这些数据进行原始数据的恢复。Chenxi [14]的另一项工作是使用基于Unet的深度学习网络对流式3d点云数据进行实时压缩。首先,将原始激光雷达点云流数据转换为2D矩阵形式,然后把数据拆分成两部分,I帧和B帧。之后,I帧将输入Unet架构进行数据插值。然后,Unet的输出与B帧相结合,用于下一阶段的处理。最后一个编码器网络用于最终的点云压缩。

03 传统的3D点云数据分析

本节主要是梳理最近的3D点云数据分类、分割和跟踪相关的重要贡献。

三维点云的第一个基本问题是分类,主要有两种方法:第一种是基于投影的方法,这种方法中点云数据先被转换成基于图像的2D或3D表示,然后在其上应用深度学习技术;在第二种方法中,如文献[1]中所述,直接处理和加工3D点云。不过,最近许多直接的点云处理算法,如基于卷积或基于图的网络都得到了更好的结果。

三维点云中第二个更普遍的问题是目标检测[1],这被认为是自动驾驶汽车行业的主要挑战之一。这里通常采用两种方法——第一种方法是基于区域的方法,第二种方法是单镜头方法。第一种方法为对象生成可能的建议区域,然后应用分类和边界框回归算法。第二种方法基于两个决定对象边界框和类分数的单层网络。这种方法比方法一更快,因为它不是两级网络。

3D点云数据中的第三个常见问题是分割。这里的问题分为三类:第一类是语义分割,第二类是实例分割,第三类是部件分割(Part Segmentation)[1]。在第一类中,使用基于投影或基于点的方法。在第二类中,使用了基于提议或无提议的分割方法。最后一个是部件分割,这里[12]使用了全卷积网络(SFCN),但这里的主要挑战是3D形状的许多褶皱。所以很难对物体的所有部分进行归纳。

04 压缩域3D点云数据分析的未来挑战

文献[2-4]的研究工作总结了在压缩域中的图像和视频处理领域中所做的各种贡献,像是特征提取、分割、分类、检测、检索等,所有这些都直接在压缩数据中完成,而不使用任何解压缩算法。具体到3D点云数据,在文献[1]中强调的基本挑战是-进行特征提取、不同类型的分割(语义、实例等)、目标检测和跟踪。因此,未来要关注的工作将是直接在3D点云数据的3D压缩域中进行相同的上述操作,而无需解压缩和再压缩数据,从而支持并实现自动驾驶的实时性能。3D压缩域的直接处理中的另一个重要挑战是对压缩数据应用深度学习模型实现实时性能,这对于世界各地的研究人员来说仍然是一个公开的问题。同时,对于图像和视频,在压缩数据上应用深度学习模型也仍然是一个待探索的热门研究课题[2][3]。

05 结论

这篇研究论文快速介绍了3D点云数据压缩领域的最新发展,该领域被认为是自动处理自动驾驶生成的3D点云激光雷达数据的挑战之一。此外,它还强调了一些挑战,并给出了一个新的角度:直接在三维压缩域来处理三维点云压缩数据。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一点人工一点智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
点云压缩研究进展与趋势
以激光扫描为代表的主动采集装备在易操作性、机动灵活性、智能化、高效化等方面日益成熟,利用三维成像技术采集密集点的空间坐标、色彩纹理和反射强度等信息,可高保真且快速重建被测目标的三维实体,在工程测量、生物医学、智慧城市、虚拟现实(VR)、增强现实(AR)等科学与工程研究中发挥十分重要的作用[1-4]。
一点人工一点智能
2023/03/13
3K0
点云压缩研究进展与趋势
论文推荐:使用三维卷积进行自监督的3D点云预测
大多数自动驾驶汽车使用 3D 激光扫描仪(即所谓的 LiDAR)来感知周围的 3D 世界。LiDAR 生成汽车周围场景的局部 3D 点云。这些 3D 点云广泛用于众多机器人和自动驾驶任务,如定位、物体检测、避障、映射、场景解释和轨迹预测。一个典型的 LiDAR 传感器每秒生成大约 10 个这样的点云。
deephub
2021/11/23
4490
万字综述 | 自动驾驶多传感器融合感知
原文:Multi-modal Sensor Fusion for Auto Driving Perception: A Survey
一点人工一点智能
2022/10/07
5.3K0
万字综述 | 自动驾驶多传感器融合感知
75. 三维重建10-立体匹配6,解析KITTI立体匹配数据集
对于立体匹配的研究来说,高质量的数据集非常关键。我之前在文章74. 三维重建9-立体匹配5,解析MiddleBurry立体匹配数据集介绍了非常著名的MiddleBurry数据集,我们看到了这个数据集从初创到后面成熟的完整过程。但即便是其最新一代数据,也大多数集中在一些静态的室内场景,如下图所示。
HawkWang
2022/08/30
1.6K0
75. 三维重建10-立体匹配6,解析KITTI立体匹配数据集
【系列文章】面向自动驾驶的三维点云处理与学习(2)
标题:3D Point Cloud Processing and Learning for Autonomous Driving
点云PCL博主
2021/03/04
7170
【系列文章】面向自动驾驶的三维点云处理与学习(2)
当视觉遇到毫米波雷达:自动驾驶的三维目标感知基准
文章:Vision meets mmWave Radar: 3D Object Perception Benchmark for Autonomous Driving
点云PCL博主
2023/12/12
7800
当视觉遇到毫米波雷达:自动驾驶的三维目标感知基准
三万字收藏 | 三维场景点云理解与重建技术
作者:龚靖渝, 楼雨京, 柳奉奇, 张志伟, 陈豪明, 张志忠, 谭鑫, 谢源, 马利庄
一点人工一点智能
2023/08/24
1.7K0
三万字收藏 | 三维场景点云理解与重建技术
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
基于LiDAR的感知系统对于自动驾驶汽车[20]或移动机器人[41]的安全导航至关重要。一个关键挑战是在车辆环境中对物体进行可靠检测和分类[54]。最先进的(SOTA)三维目标检测方法在很大程度上依赖于用于训练的数据集的质量和多样性,同时也取决于这些数据集在推理过程中如何真实地反映现实世界条件。获取和标注此类数据仍然是一项重大的技术和实践挑战,既耗时又劳动密集。这在三维目标检测模型的大规模开发和部署中构成了一个主要障碍。
集智书童公众号
2024/05/10
9240
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
三维点云分割综述(上)
三维点云的语义分割3D Point Cloud Semantic Segmentation (PCSS)在计算机视觉以及机器人领域广泛的应用,随着深度学习技术的发展在点云的语义分割领域提供了新的可能性,并受到越来越多的关注,本文将着重的介绍这一主题的相关研究,首先从遥感领域和计算机视觉的角度概述三维点云的分割,并且结合已经发表的PCSS相关的文章作为研究基础,进行总结和比较,并且对传统的以及最新的点云分割技术进行回顾和比较,最后讨论了PCSS研究中重要的问题和有待解决的问题。
点云PCL博主
2020/08/02
3.6K1
自动驾驶中图像与点云融合的深度学习研究进展综述
文章:Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review
3D视觉工坊
2020/11/11
3.7K0
自动驾驶中图像与点云融合的深度学习研究进展综述
基于 Transformer 的多模态融合方法用于语义分割 !
环境语义分割是自动驾驶中的一个挑战性课题,并在诸如操纵、路径规划和场景理解等智能车辆相关研究中发挥着关键作用。由于深度神经网络的进步,特别是卷积神经网络(CNN),以及开放数据集的可用性,语义分割领域已取得了巨大进展。早期研究采用相机的RGB图像作为输入,并用具有相对单调场景的数据集进行测试。近年来,感知传感器行业的蓬勃发展以及严格的安全要求推动了涉及不同传感器和综合场景的语义分割研究。在各种研究中,激光雷达传感器(LiDAR)参与最多。流行的仅激光雷达方法包括VoxNet[6]、PointNet[7]和RotationNet[8]。然而,多模态传感器融合被视为解决自动驾驶问题的有前途的技术,并已成为语义分割的主流选择。
未来先知
2024/08/20
1.1K0
基于 Transformer 的多模态融合方法用于语义分割 !
关于使用深度学习进行三维点云几何压缩
近些年来,随着计算机软硬件等的不断发展,计算机视觉、现实增强等让那些我们觉得不会发生的事情发生了,不得不说,科技正在改变我们的生活,给我们的生活带来了更多的便利。
繁依Fanyi
2023/05/07
7840
关于使用深度学习进行三维点云几何压缩
大盘点|三维视觉与自动驾驶数据集(40个)
简介:KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的算法评测数据集。该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。整个数据集由389对立体图像和光流图,39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成,以10Hz的频率采样及同步。对于3D物体检测,label细分为car, van, truck, pedestrian, pedestrian(sitting), cyclist, tram以及misc。
3D视觉工坊
2021/07/29
2K0
用于三维点云语义分割的标注工具和城市数据集
文章:Annotation Tool and Urban Dataset for 3D Point Cloud Semantic Segmentation
点云PCL博主
2022/04/06
2.2K0
用于三维点云语义分割的标注工具和城市数据集
【点云论文速读】基于YOLO和K-Means的图像与点云三维目标检测方法
标题:3D Object Detection Method Based on YOLO and K-Means for Image and Point Clouds
点云PCL博主
2020/08/10
2.3K0
【点云论文速读】基于YOLO和K-Means的图像与点云三维目标检测方法
自动驾驶中车辆的如何使用点云定位?
标题:Review on 3D Lidar Localization for Autonomous Driving Cars
点云PCL博主
2020/08/20
3.2K0
自动驾驶中车辆的如何使用点云定位?
基于激光雷达和单目视觉融合的SLAM和三维语义重建
文章:SLAM and 3D Semantic Reconstruction Based on the Fusion of Lidar and Monocular Vision
点云PCL博主
2023/08/21
1.7K0
基于激光雷达和单目视觉融合的SLAM和三维语义重建
【系列文章】面向自动驾驶的三维点云处理与学习(4)
标题:3D Point Cloud Processing and Learning for Autonomous Driving
点云PCL博主
2021/03/04
4050
【系列文章】面向自动驾驶的三维点云处理与学习(4)
面向自动驾驶的三维目标检测研究综述
文章:3D Object Detection for Autonomous Driving: A Survey
点云PCL博主
2022/02/10
1.5K0
面向自动驾驶的三维目标检测研究综述
【系列文章】面向自动驾驶的三维点云处理与学习(6)-完结篇
标题:3D Point Cloud Processing and Learning for Autonomous Driving
点云PCL博主
2021/03/24
1.3K0
【系列文章】面向自动驾驶的三维点云处理与学习(6)-完结篇
推荐阅读
相关推荐
点云压缩研究进展与趋势
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档