Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >前车要干吗?对前车微小运动的行为研究

前车要干吗?对前车微小运动的行为研究

作者头像
一点人工一点智能
发布于 2024-05-29 06:39:11
发布于 2024-05-29 06:39:11
1110
举报

论文:Instantaneous Perception of Moving Objects in 3D

作者:Di Liu, Bingbing Zhuang, Dimitris N. Metaxas, Manmohan Chandraker

收录:CVPR2024

论文地址:https://arxiv.org/abs/2405.02781

编辑:东岸因为@一点人工一点智能

摘要:

这篇论文探讨了三维空间中移动物体瞬间感知的问题。作者指出,虽然现有的研究主要关注于一般的大型运动,但对物体瞬间微小运动的检测和量化同样重要,因为它可能预示着驾驶行为中的细微变化,这些变化可能对交通安全至关重要。例如,停车车辆开始移动或前行车辆突然停下并倒车等行为。

论文提出了一种方法,利用局部占位补全来增加点云的形状线索密度,从而减轻所谓的“泳动现象(swimming effect)”,这种效应会与真实物体的运动交织在一起,导致估计不准确。

作者通过实验证明了他们方法的有效性,特别是在处理微小运动方面,与传统的3D运动估计方法相比具有优势。此外,他们还精心设计了一个基准测试,用以评估这一未被充分研究的任务。

引言

在所处环境中,对邻近移动物体周围的3D运动感知对于驾驶安全至关重要。虽然现有的工作主要关注一般的大运动,但我们认为,瞬时检测和量化微小运动同样重要,因为它们可以指示驾驶行为的细微变化,这可能对安全至关重要,例如停车位附近的车辆行为。我们对这个未充分探索的任务进行了深入研究,考察了其独特的挑战,并开发了解决方案,同时精心设计了一个基准测试。

具体来说,由于稀疏激光雷达点云帧之间的缺乏对应,静态物体可能看起来像是在移动——所谓的“泳动现象”。这与真正的物体运动交织在一起,从而会产生模糊和不准确的估计,特别是在微小运动的情况下。

为了解决这个问题,我们的框架建议利用局部占用完成目标物体点云来密集化形状线索,并减轻泳动现象的影响。与移动物体检测和它们运动估计一起,占用完成在端到端的方式中一起学习。我们还将我们的见解转化为在专门针对微小运动的新评估基准测试中的有利性能。

总的来说,我们的贡献包括:

· 引入检测和估计车辆微小运动的任务,以及它们的实际意义和挑战。

· 设计一个框架,利用占用完成来减轻微小运动估计的“泳动现象”。

· 将我们的见解转化为在新的评估基准测试中的有利性能,该基准测试专门针对微小运动。

方法

2.1 问题定义和挑战

我们的目标是利用连续的点云来识别移动对象并估计它们的速度。微小运动的检测和估计面临挑战,主要源于激光雷达点云的稀疏性。激光雷达传感器只能捕获周围场景的稀疏点集,且这些点云的分布取决于激光雷达与场景元素的相对位置。因此,在短时间内,激光雷达的多个帧通常只能观察到物体表面的一小部分。

由于没有跨帧的精确点对应,静态场景元素看起来也可能像是在移动,这就是所谓的“泳动现象”[21]。这种效应与真正的物体运动交织在一起,使得微小运动难以准确表征,尤其是要区分真运动与泳动现象。

2.2 我们的框架

图2概述了S'More的框架。给定连续的激光雷达帧,我们首先通过过滤掉背景和具有大运动的物体识别出感兴趣的对象。然后对每个对象点云进行体素化,通过编码器-解码器网络提取特征,并进行占用补全。输出结果输入到运动检测器和运动流预测器中,用于最终的运动检测和估计。

2.2.1 占用补全

由于激光雷达点云的稀疏性,我们首先学习占用补全,密集化物体表面的形状线索,从而减轻泳动现象的影响。占用补全利用附近帧的信息来密集化局部占用网格,如图2所示。对于每个帧

,我们将其余T-1帧中的所有激光雷达点通过已知物体运动(已从观测中分离出本体运动)变换到

帧,并标记对应的体素为占用,即值为1。我们还标记视线方向上的点为空,即值为0。其他体素标记为未知。我们使用快速体素遍历算法[2]实现这一步骤。

2.2.2 网络架构和损失

我们使用编码器-解码器网络进行占用网格预测和静态/移动对象分类,并进一步用于运动检测器和运动流预测器。运动检测器将输入对象分类为静态或移动,而运动流预测器对每个占用的体素进行运动向量的回归。我们使用编码器-解码器结构,包括简单的卷积层和跳跃连接,如图6所示。

总体损失函数由占用损失、运动损失、尺度相关的运动流预测损失、相对流损失和角度损失加权组合而成。具体而言,我们为占用网格预测使用二元交叉熵损失,为静态/移动对象分类使用二元交叉熵损失,为运动流预测使用尺度相关的损失,为运动方向预测使用角度损失。

Overall Losses:

Occupancy Loss:

Relative flow loss:

Augular loss :

2.2.3 训练和推理

我们使用在Waymo开放数据集[46]上提取的微小运动数据进行训练。我们收集每个对象连续5帧的点云,共收集约140k个训练样本和9k个测试样本。我们使用标准F1分数来评估静态/移动对象分类的准确性,使用端点误差(EPE)和角度误差来评估运动流误差。

我们使用Adam优化器进行训练,学习率为0.001,动量为0.9。我们在每个对象上单独处理点云,但整体上运行速度可达每秒27帧,适用于包含30个感兴趣对象的场景。

在推理时,我们使用S'More的占用补全模块来增强点云,然后输入到运动检测器和运动流预测器中进行最终的运动检测和估计。

实验

3.1 S'More的评估

评估基准。由于没有专门针对微小运动的现有基准测试,我们从Waymo开源数据集中提取微小运动,利用其现有的注释。我们收集每个对象连续5帧的点云,共收集约140k个训练样本和9k个测试样本。我们使用标准F1分数来评估静态/移动对象分类的准确性,使用端点误差(EPE)和角度误差来评估运动流误差。

比较方法。在缺乏专门针对微小运动的检测方法的情况下,我们主要与经典迭代最近点(ICP)方法、点-平面ICP、广义ICP、Fast NSF和CenterPoint进行比较。

结果。表1显示了定量评估结果,表明我们的模型与所有基线相比在微小运动估计方面具有显著优势,尤其是在局部注册方面。

3.2 占用补全的影响

为了调查占用补全的影响,我们将占用模块从S'More中移除,并与仅将占用补全作为辅助任务的设置进行比较。我们报告了准确度,如图6(e)(f)所示,表明占用补全对良好性能有显著影响。我们将其归因于它在有效增强物体表面方面的作用。如图6(d)所示,我们提供了点云注册的可视化,以评估估计的运动,进一步支持占用补全的有效性。占用补全本身的定性结果如图7所示。

3.3 大运动下的表现

尽管我们的重点是微小运动,但研究其在较大运动下的表现也很重要。为此,我们训练了一个包括大运动数据的S'More模型,并在仅在大运动(fm in>0.2m)的 regime下进行评估。如表3所示,S'More和CenterPoint都实现了接近完美的检测精度(F1→1.0),正如预期的那样,由于大信号-噪声比。这种完美性支持我们的重点是增强微小运动,以提高实际系统的性能。我们还注意到,作为检测跟踪方法,CenterPoint在精度上更胜一筹,因为其准确性很大程度上取决于3D框定位,而不是运动。

3.4 与延迟相关的评估

由于重点是即时检测,一个时间敏感的任务,评估与时间相关的指标也很有帮助。我们原始的任务是在不超过0.5s的延迟内检测移动对象。在这里,我们增加

以针对更大的运动,这实际上允许如果假设恒定速度,则相应地增加延迟,从而减少对延迟的要求。我们在表5中报告了不同延迟下的检测精度(F1),表明S'More的性能一致优于其他方法。

3.5 重要设计选择

网格大小。我们研究了占用网格大小的影响,并发现它在我们的设计中很重要。我们比较了两个网格大小:平衡的100×100×100网格和另一个500×500×4网格,后者在z轴分辨率上显著降低。结果如图9(a)所示,当z轴分辨率降低时,性能明显下降(两条虚线始终低于实线)。这还可能导致由于模型在区分细微垂直变化方面的能力降低而引起的检测歧义。

结论

综上所述,本论文定义了检测车辆微小运动的问题,提出了其实际意义。为减轻微小运动感知中的泳动现象,我们利用占用补全作为有效策略来促进运动学习。尽管整体性能良好,但我们的方法在极端稀疏或高度遮挡的目标下面临挑战。我们目前也只处理了车辆而不处理行人和骑行者。我们希望这项工作和其局限性能够激发对这个重要但未充分探索问题的更多研究。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一点人工一点智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
解析激光雷达中时序融合的研究现状和发展方向
在自动驾驶领域,基于激光雷达 (LiDAR) 的3D物体检测和运动行为预测是一种普遍的方案。目前绝大部分关于激光雷达的物体检测算法都是基于单帧的。激光雷达的多帧时序数据,提供了对于检测物体的多视角观测 (multiple views),历史记忆 (history memory),安全冗余 (redundant safty),以及运动特征 (motion kinematics) 等丰富的信息;可用来帮助提高检测速度和精度,并且增加检测结果的可靠性。对于感知的下游模块,例如追踪和预测,时序信息则更为重要。
小白学视觉
2020/06/19
9310
解析激光雷达中时序融合的研究现状和发展方向
端到端基于图像的伪激光雷达3D目标检测
标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection
3D视觉工坊
2021/04/13
9090
端到端基于图像的伪激光雷达3D目标检测
清华大学&英伟达最新|Occ3D:通用全面的大规模3D Occupancy预测基准
自动驾驶感知需要对3D几何和语义进行建模。现有的方法通常侧重于估计3D边界框,忽略了更精细的几何细节,难以处理一般的、词汇表外的目标。为了克服这些限制,本文引入了一种新的3D占用预测任务,旨在从多视图图像中估计目标的详细占用和语义。为了促进这项任务,作者开发了一个标签生成pipeline,为给定场景生成密集的、可感知的标签。该pipeline包括点云聚合、点标签和遮挡处理。作者基于Waymo开放数据集和nuScenes数据集构造了两个基准,从而产生了Occ3D Waymo和Occ3D nuScene基准。最后,作者提出了一个模型,称为“粗略到精细占用”(CTF-Occ)网络。这证明了在3D占用预测任务中的优越性能。这种方法以粗略到精细的方式解决了对更精细的几何理解的需求。
公众号-arXiv每日学术速递
2023/08/26
1.2K0
清华大学&英伟达最新|Occ3D:通用全面的大规模3D Occupancy预测基准
轻舟智航“轻、快、高效”的高级感知技术加速无人车上路!
“无人车长大了!”,“无人车能自己赚钱了!”,“无人车成精了吗”......这是不少网友观看上述视频之后的感受。
AIWalker
2021/12/31
1.2K0
轻舟智航“轻、快、高效”的高级感知技术加速无人车上路!
Center-based 3D Object Detection and Tracking
三维物体通常表示为点云中的三维框。 这种表示模拟了经过充分研究的基于图像的2D边界框检测,但也带来了额外的挑战。 3D世界中的目标不遵循任何特定的方向,基于框的检测器很难枚举所有方向或将轴对齐的边界框匹配到旋转的目标。 在本文中,我们提出用点来表示、检测和跟踪三维物体。 我们的框架CenterPoint,首先使用关键点检测器检测目标的中心,然后回归到其他属性,包括3D尺寸、3D方向和速度。 在第二阶段,它使用目标上的额外点特征来改进这些估计。 在CenterPoint中,三维目标跟踪简化为贪婪最近点匹配。 由此产生的检测和跟踪算法简单、高效、有效。 CenterPoint在nuScenes基准测试中实现了最先进的3D检测和跟踪性能,单个模型的NDS和AMOTA分别为65.5和63.8。 在Waymo开放数据集上,Center-Point的表现远远超过了之前所有的单一模型方法,在所有仅使用激光雷达的提交中排名第一。
狼啸风云
2021/10/13
2.1K0
自动驾驶中基于光流的运动物体检测
文章:Optical Flow Based Motion Detection for Autonomous Driving
点云PCL博主
2022/09/13
1.6K0
自动驾驶中基于光流的运动物体检测
Direct LiDAR-Inertial Odometry: 具有连续时间运动校正的轻量级LIO
文章:Direct LiDAR-Inertial Odometry: Lightweight LIO with Continuous-Time Motion Correction
点云PCL博主
2023/08/21
1.1K0
Direct LiDAR-Inertial Odometry: 具有连续时间运动校正的轻量级LIO
OpenOccupancy:一个用于周视语义占用网格感知的基准测试
文章:OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception
点云PCL博主
2023/08/21
6200
OpenOccupancy:一个用于周视语义占用网格感知的基准测试
RSLO:自监督激光雷达里程计(实时+高精度,ICRA2022)
激光雷达在自动驾驶中是个必要的传感器,但是激光雷达由于自身数据的稀疏性和信噪比的问题会给运动估计的鲁棒性带来比较大的挑战,如下图,即使是两帧相邻的激光雷达点云,也会由于动态物体和错位带来一个误匹配,这种误匹配对于激光雷达里程计是非常致命的,所以如何发现并且减轻这些不可靠区域的权重是一个值得研究的问题。
3D视觉工坊
2023/04/29
3980
RSLO:自监督激光雷达里程计(实时+高精度,ICRA2022)
【论文解读】深度学习+深度激光=移动车辆的状太估计
• 数据集:distilled Kitti Lidar-Motion dataset
小白学视觉
2020/06/12
6450
专访 | CVPR PAMI青年研究员奖得主Andreas Geiger:自动驾驶中的计算机视觉
在今年 6 月召开的 CVPR2018 上,德国图宾根大学及马克斯·普朗克研究所(MPI)自动视觉组负责人 Andreas Geiger 教授摘得了 PAMI Young Researcher Award,该奖项颁发给 7 年内获得博士学位且早期研究极为有潜力的研究人员。
机器之心
2018/08/07
5150
专访 | CVPR PAMI青年研究员奖得主Andreas Geiger:自动驾驶中的计算机视觉
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
尽管神经辐射场(NeRFs)在图像新视角合成(NVS)方面取得了成功,但激光雷达NVS的发展却相对缓慢。之前的方法follow图像的pipeline,但忽略了激光雷达点云的动态特性和大规模重建问题。有鉴于此,我们提出了LiDAR4D,这是一种用于新的时空LiDAR视图合成的LiDAR-only的可微分框架。考虑到稀疏性和大规模特征,进一步设计了一种结合多平面和网格特征的4D混合表示,以实现从粗到细的有效重建。此外引入了从点云导出的几何约束,以提高时序一致性。对于激光雷达点云的真实重建,我们结合了ray-drop概率的全局优化,以保持cross-region模式。在KITTI-360和NuScenes数据集上进行的大量实验证明了我们的方法在实现几何感知和时间一致的动态重建方面的优越性。
公众号-arXiv每日学术速递
2024/04/25
6430
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
导航系统中里程计研究综述
文章:A Survey on Odometry for Autonomous Navigation Systems
3D视觉工坊
2020/12/11
1.2K0
导航系统中里程计研究综述
值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)
【导读】上周,我们在《激光雷达,马斯克看不上,却又无可替代?》一文中对自动驾驶中广泛使用的激光雷达进行了简单的科普,今天,这篇文章将各大公司和机构基于激光雷达的目标检测工作进行了列举和整合。由于文章列举方法太多,故作者将其分成上下两部分,本文为第一部分。
AI科技大本营
2019/09/19
2.7K0
值得收藏!基于激光雷达数据的深度学习目标检测方法大合集(上)
非重复型扫描激光雷达的运动畸变矫正
文章:Lidar with Velocity: Motion Distortion Correction of Point Clouds from Oscillating Scanning Lidars
点云PCL博主
2022/09/13
1.2K0
非重复型扫描激光雷达的运动畸变矫正
SAGE-ICP:语义信息辅助的ICP方法
文章:SAGE-ICP: Semantic Information-Assisted ICP
点云PCL博主
2023/11/17
5220
SAGE-ICP:语义信息辅助的ICP方法
OCC-VO:生成面向自动驾驶的基于3D占用栅格的视觉里程计稠密地图
代码:https://github.com/USTCLH/OCC-VO.git (coming soon)
点云PCL博主
2023/10/25
7320
OCC-VO:生成面向自动驾驶的基于3D占用栅格的视觉里程计稠密地图
基于3D激光雷达的SLAM算法研究现状与发展趋势
SLAM算法是移动机器人实现自主移动的关键环节。激光雷达(LiDAR)具有测距精度高、不易受外部干扰和地图构建直观方便等优点,广泛应用于大型复杂室内外场景地图的构建。随着3D激光器的应用与普及,国内外学者围绕基于3D激光雷达的SLAM算法的研究已取得丰硕的成果。
一点人工一点智能
2023/08/25
3.2K0
基于3D激光雷达的SLAM算法研究现状与发展趋势
直接激光雷达里程计:基于稠密点云的快速定位
文章:Direct LiDAR Odometry:Fast Localization with Dense Point Clouds
点云PCL博主
2022/01/27
1.2K0
直接激光雷达里程计:基于稠密点云的快速定位
基于3D激光雷达的SLAM算法研究现状与发展趋势
SLAM算法是移动机器人实现自主移动的关键环节。激光雷达(LiDAR)具有测距精度高、不易受外部干扰和地图构建直观方便等优点,广泛应用于大型复杂室内外场景地图的构建。随着3D激光器的应用与普及,国内外学者围绕基于3D激光雷达的SLAM算法的研究已取得丰硕的成果。
一点人工一点智能
2023/04/26
1.6K0
基于3D激光雷达的SLAM算法研究现状与发展趋势
推荐阅读
相关推荐
解析激光雷达中时序融合的研究现状和发展方向
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档