Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >BOX3D:面向三维目标检测与定位的轻量级相机-激光雷达融合方案

BOX3D:面向三维目标检测与定位的轻量级相机-激光雷达融合方案

作者头像
点云PCL博主
发布于 2025-05-26 02:22:52
发布于 2025-05-26 02:22:52
1450
举报
文章被收录于专栏:点云PCL点云PCL

文章:BOX3D: Lightweight Camera-LiDAR Fusion for 3D Object Detection and Localization

作者:Mario A.V. Saucedo† , Nikolaos Stathoulopoulos† , Vidya Sumathy, Christoforos Kanellakis and George Nikolakopoulos

编辑:点云PCL

欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。

从技术角度观察行业发展,努力跟上时代的步伐。公众号致力于点云处理,SLAM,三维视觉,具身智能,自动驾驶等领域相关内容的干货分享

摘要

物体检测与全局定位技术在机器人领域具有关键作用,其应用范围涵盖从自动驾驶汽车到多层三维场景图谱的语义场景理解等多个领域。本文提出BOX3D——一种通过融合RGB相机与三维激光雷达信息来实现目标物体定位的新型多模态轻量化方案。该方案采用三层递进式架构设计:首先,底层架构对相机与激光雷达数据进行初级融合处理,完成初始三维边界框提取。其次,中间层将激光雷达扫描获取的三维边界框转换至世界坐标系,通过空间配对与合并机制确保多视角观测中物体的唯一性表征。最终,顶层采用迭代式全局监督机制,通过点-体素比对算法识别全局地图中属于目标物体的所有点云数据,从而保证观测结果的全局一致性。为验证该创新架构的性能,研究团队在多个公开城市环境大规模数据集上进行了系统性实验验证。测试结果表明,BOX3D方案在保持计算轻量化的同时,能够有效处理传感器数据异常值,并显著提升复杂场景下的物体定位精度。特别值得注意的是,该方案提出的分层处理机制成功实现了局部感知到全局优化的无缝衔接,为动态环境中的多模态传感器融合提供了新的技术范式。

主要贡献

本文提出BOX3D,一种基于相机-激光雷达的快速物体检测与定位新框架,其三层架构实现点云数据的渐进式物体检测:第一层采用先进YOLOv8模型在RGB图像中生成2D边界框与分割掩膜,通过相机内外参将其投影至激光雷达点云,结合欧氏聚类过滤背景点云,最终生成置信度超过阈值的3D边界框;第二层将当前扫描的3D边界框转换至世界坐标系,基于重叠度与历史检测结果配对融合;第三层通过聚类优化实现世界点云中目标物体的精确分割。图1展示了该框架的整体架构。

其次在大型城市环境数据集上对方法进行基准测试。实验结果表明,该框架在构建环境地图的同时,能够实现快速精确的物体检测。具体表现为:

(1)检测速度较传统方法提升40%;

(2)在复杂城市场景中保持85%以上的检测准确率;

(3)有效融合多传感器数据,解决单一传感器在动态环境中的局限性。

图1:本文提出的BOX3D框架示意图,展示各层级的输入输出。其中粉色点云表示检测到的目标物体,白色点云对应环境中的其他点云数据。

主要内容

图2所示功能框图展示了本研究所提框架的整体架构。该框架采用三层级联结构:第一层级在图像坐标系中生成边界框与分割掩膜,并将其转换至激光雷达坐标系生成3D边界框,同时确保较低的计算耗时;第二层级通过评估当前检测3D边界框与历史检测结果的交并比(IoU),当重叠度超过设定阈值时执行边界框融合,生成优化后的新3D边界框;第三层级则对世界点云中的目标对应点云进行聚类优化,并计算物体在世界坐标系中的精确位姿。

图2:基于相机-激光雷达融合的轻量化物体检测与定位框架功能框图

A. 坐标系与坐标变换

本系统涉及三个关键坐标系:固定不动的世界坐标系(W)定义机器人工作空间,安装在激光雷达传感器上的雷达坐标系(L),以及相机传感器对应的图像坐标系(C)。坐标变换过程可分为两个核心步骤:

  1. 点云投影成像:通过相机内参矩阵(包含焦距和主点参数)结合雷达-相机外参(旋转矩阵和平移向量),将雷达坐标系中的三维点云坐标转换为二维图像像素坐标。该过程能准确建立三维点云与二维图像像素之间的映射关系。
  2. 世界坐标转换:利用融合直接雷达里程计(DLO)与惯性测量单元(IMU)数据的算法,实时计算雷达坐标系到世界坐标系的变换矩阵。这种多传感器融合方法显著提升了位姿估计的精度和鲁棒性。

B. 三维边界框生成

本框架首先采用基于COCO数据集[21]训练的YOLOv8n模型进行目标检测与分割。该模型输入RGB图像后输出包含以下信息的检测结果:每个边界框的中心坐标、宽高尺寸、80个类别置信度、32个掩膜权重以及160×160像素的原型掩膜。通过非极大值抑制(NMS)筛选出置信度超过阈值的有效边界框集合,同时将原型掩膜与对应权重相乘后求和,经形态学腐蚀滤波处理得到最终分割掩膜(图3b-c),该处理能有效减少误检。

随后将同步采集的激光雷达点云投影至图像坐标系(图3d),根据分割掩膜为每个投影点分配实例标签(背景或目标物体)。通过欧氏聚类算法对标记点云进行离群点过滤,选取点数最多的簇作为目标物体点云,最终生成带标签的点云簇集合及其对应的三维边界框集合(图3e)。具体实现中,我们假设点云数量最多的簇即为目标物体所在区域。

图3:3D边界框生成模块上每个步骤的输入(a)和输出示例,其中2D边界使用分割掩模(c)将框(b)映射到3D坐标,以标记投影点云(d)上的点。

C. 三维边界框配对与融合

由于机器人平台持续运动,相机视野和激光雷达探测范围内可见物体会动态变化,导致每帧图像生成的3D边界框集合不断更新。为避免对同一物体生成重复边界框并提升检测精度,系统执行以下处理流程:

首先,通过DLO框架提供的坐标变换矩阵,将当前帧的3D边界框从激光雷达坐标系转换至世界坐标系。虽然连续扫描获得的点云簇在空间上可能不相交,但对应同一物体的边界框通常存在重叠区域。

当检测到当前帧边界框与历史边界框的重叠率超过设定阈值时,系统判定两者属于同一物体实例。此时将执行边界框融合操作:根据两个匹配点云簇的空间分布,拟合生成一个能完整包含所有点云的新3D边界框,最终输出优化后的全局边界框集合。

D. 全局地图定位

为实现目标物体在全局地图中的精确定位,需聚合该物体在世界点云中的所有关联点。随着机器人移动,世界点云数据持续累积,即使当YOLOV8n模型未能检测到某些物体时,其对应点云仍可能被记录。此外,相机视野外的物体若处于激光雷达探测范围内,其点云数据也将在后续更新中被纳入。传统方法中,简单合并当前帧与历史帧的匹配聚类点云(即dWt ∪ dWτ<t)难以完整覆盖物体所有关联点。为此本框架在每次3D边界框融合后增加聚类优化步骤:以每对匹配聚类点为中心,构建边长为r的立方体空间范围,提取该空间内所有世界点云数据,生成优化后的独立聚类集合DW。最终通过计算各聚类质心位置,确定物体在全局地图中的精确坐标。

实验与结果

A. 数据集与基准测试

采用KITTI数据集对本框架性能进行评估,该数据集包含大规模真实城市环境的图像与激光雷达扫描数据,并配有真实3D边界框标注。测试平台搭载第12代Intel® Core™ i9-12900KF处理器,主要评估指标包括各层级的平均处理耗时与平均交并比(mIoU)。耗时对比实验基于YOLOv8n模型展开,结果如表I所示:第二层级因需遍历历史所有3D边界框进行融合判断,计算负荷最为显著(其耗时随检测物体数量线性增长);第一层级耗时次之;第三层级得益于优化的聚类算法,处理效率最优。

此外,表II展示了采用不同规模YOLOv8模型时本框架获得的平均交并比(mIoU)结果,并列出相应YOLO模型的mIoU作为对比基准。实验表明,本框架的mIoU指标与所选检测模型的性能高度吻合——当采用YOLOv8x模型时,框架mIoU达到85.3%,仅比基础检测模型低1.2个百分点;而使用轻量级YOLOv8n模型时,框架mIoU为78.6%,与模型自身精度差距缩小至0.8个百分点。这一结果验证了框架性能随检测模型精度提升而增强的设计特性。

图4与图5展示了基于YOLOv8n模型的3D边界框检测可视化效果。图中红色边界框表示漏检目标(如被树木遮挡的交通标志),橙色边界框代表局部检测(边界框仅覆盖目标不足50%区域)。值得注意的是:

1. 在30米探测范围内,完整检测率可达91.2%

2. 主要漏检发生在高密度车流场景(检测率下降12.5%)

3. 局部检测多源于目标部分遮挡(占总误差的63.8%)

图4:全局地图上检测到的对象的3D边界框的可视化以及漏检和部分检测的不同实例的可视化。

图5:全局地图上检测到的对象的3D边界框的可视化[B],以及漏检和部分检测的不同实例的可视化。

B. 局限性

该框架的主要局限性来源于融合过程中由各个传感器自身的不足引起的一些问题,具体如下所述:

分割噪声(Segmentation Noise)

语义分割过程通常会错误地将靠近物体边缘的像素标记为物体的一部分。腐蚀处理有助于缓解这些缺陷的影响。然而,在腐蚀过程中,可能会出现属于物体的点在将点云投影到分割掩码上时被误标为背景的情况。

视场范围(Field Of View)

使用 LiDAR 传感器的一个优势是其具备 360° 的视场范围,而其他传感器(如摄像头)通常具有较小的视场范围。我们的框架在第一阶段无法充分利用 LiDAR 的这一特性,尽管在优化步骤考虑了来自 LiDAR 点云中超出摄像头视场范围的点。然而,它仍可能遗漏属于目标物体的小部分点。

总结

本文提出了一种基于摄像头-LiDAR 融合的轻量级目标检测与定位框架——BOX3D。BOX3D 是一种新颖的三层架构:第一层侧重于从二维目标分割和 LiDAR 点云投影中高效生成三维边界框;第二层通过空间合并与配对,将后续的三维边界框统一为每个目标实例的唯一边界框;第三层则利用基于 LiDAR 的全局点云信息,对每个唯一的三维边界框簇结合所有邻近点进行细化调整。此外所提出的方法在 KITTI 数据集提供的大规模真实城市环境中进行了实验验证。测试结果证明了 BOX3D 架构在目标检测与定位任务中的有效性与竞争力。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 点云PCL 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
React Native 开发工具推荐
近几年在大前端的开发领域,选择跨端方案的公司和部门越来越多,曾一何时市面有不下10种跨端框架,但随着“生物进化论”的推动,目前市面上仅剩两种主流方案,就是经常听到的 React Native 和 Flutter。去年终于引来了 React Native 的新版本 0.70.0,开发者也大为振奋。
Onegun
2023/04/19
1.9K0
React Native 开发工具推荐
移动开发者必备的 React Native 开发工具
近几年在大前端的开发领域,选择跨端方案的公司和部门越来越多,曾一何时市面有不下10种跨端框架,但随着“生物进化论”的推动,目前市面上仅剩两种主流方案,就是经常听到的 React Native 和 Flutter。去年终于引来了 React Native 的新版本 0.70.0,开发者也大为振奋。
凡泰极客
2023/04/21
2K0
使用umi开发react-native应用
自此,开发者可以迅速投入到业务代码的开发,而不用去搭建脚手架,写一堆配置和胶水代码去整合各种框架等等。
conanma
2021/11/02
6.9K0
我不认为Flutter比React Native好
Jamon Holmgren 是一家软件开发公司的创始人兼 CTO,拥有超过 25 年的编程经验,同时也是 React Native 的核心成员,维护着几个开源库。在这篇文章里,他试着尽可能公平地从多方面去讨论 Flutter 和 React Native 的优劣势。本文仅代表他个人观点,希望能为读者带来收获。
深度学习与Python
2022/03/22
2.7K0
前端开发工具的优化使用:提升效率与体验的实战技巧
作为一名前端开发者,我们每天都在与代码打交道。从编写页面布局到实现复杂的交互,再到调试和优化性能,前端的工作内容既丰富又挑战十足。幸运的是,随着前端开发工具的不断升级和完善,我们有了越来越多的利器来提升工作效率,让开发变得更加轻松高效。
Echo_Wish
2025/03/01
1180
前端开发工具的优化使用:提升效率与体验的实战技巧
Luna:你想要的 React Native 调试工具
React Native(以下简称 RN)目前在 Shopee 前端团队得到大量应用。RN 虽然有很多优势,但是其开发和调试流程与 Mobile Web 相比却不那么友好,特别是在运行时的调试。
Shopee技术团队
2022/01/28
2.2K0
Luna:你想要的 React Native 调试工具
Flutter 与 React Native - 详细深入对比分析(2024 年)
Flutter 和 React Native 是跨平台应用程序开发的两个领先工具。了解它们的差异以及各自的最佳用例。
一点一木
2024/10/15
2.2K0
Flutter 与 React Native - 详细深入对比分析(2024 年)
ReactJS和React-Native的主要区别在哪里
React-Native已经存在了约2年,而且因为它能被Android使用让我们构建跨平台的移动app而成为真正有趣的框架。一些开发者还为构建适用于Mac和Windows的桌面应用程序量身打造了一些框架,这简直太酷了。
疯狂的技术宅
2019/03/27
18.2K0
ReactJS和React-Native的主要区别在哪里
React Native 学习资源精选仓库
React Native Awesome汇集了各类react-native学习资料、工具、组件、开源App、资源下载、以及相关新闻等,只求精不求全。 如果你是一名React Native爱好者,或者有一颗热爱钻研新技术的心,喜欢分享技术干货、项目经验、以及你在React Naive学习研究或实践中的一些经验心得等等,欢迎投稿《React Native Awesome》。 如果你是一名Android、iOS、或前端开发人员,有者一颗积极进取的心,欢迎关注《React Native Awesome》。本项目汇
CrazyCodeBoy
2018/05/07
3.1K0
跨端开发框架:一次编码,多端运行的终极解决方案
跨端开发框架是现代应用程序开发的一项重要技术,它使开发者能够使用一套代码基础构建应用程序,并在多个平台上运行,包括Web、移动和桌面。本文将深入探讨跨端开发框架的关键概念,为您提供一份全面的指南,并提供带有实际代码示例的技巧,以帮助您构建强大的跨平台应用。
海拥
2023/09/19
1.5K0
跨端开发框架:一次编码,多端运行的终极解决方案
使用Expo开发React-native程序(一)
开发React-native程序,除了官方提供的React-native CLI外,目前还有一个新的选择Expo。
蒙古上单2
2024/04/09
2.2K2
移动端调试技巧与工具:构建无缝的开发体验
在移动应用开发过程中,调试是不可或缺的一部分。了解如何有效地调试移动应用,可以提高开发效率并改善应用的质量。本文将深入探讨移动端调试的关键技巧和工具,为您提供一份全面的指南,并提供带有实际代码示例的技巧,以帮助您构建更出色的移动应用。
海拥
2023/09/19
5200
移动端调试技巧与工具:构建无缝的开发体验
如今大家还会如何评价 React Native
1、跨平台省钱大法好:我记得当年团队组长拍着桌子说“安卓和iOS各招5个人”的画面,后面一个同事用RN写了个Demo,成功把团队砍到3人。react native的跨平台大法让同一套代码跑双端,是真的省心好用。
Onegun
2025/03/19
2670
如今大家还会如何评价 React Native
Taro3.2 适配 React Native 之运行时架构详解
由 58 前端团队主导的 Taro 3 适配 React Native 工作已完成有一段时间了。目前发布了多个体验版,也将在3月底迎来正式版。基于 Taro 的良好架构演变,适配 React Native 的方案的也做了较大调整,本文将主要介绍 Taro 3 适配 React Native 运行时相关的详细设计与实现。
PHP开发工程师
2021/05/24
2.8K0
Taro3.2 适配 React Native 之运行时架构详解
React Native 核心技术知识点快速入门
Node.js 是 JavaScript 的运行环境,npm 是 Node.js 的包管理器。可以从 Node.js 官方网站 下载并安装适合你操作系统的版本。
威哥爱编程
2025/02/28
5140
干货 | 携程机票 React Native 整洁架构实践
携程机票前台团队在使用 React Native 实现众多业务的过程中,经历了前期少量探索,中期大量应用,后期架构和性能优化的三个阶段。
携程技术
2019/07/22
1.9K0
干货 | 携程机票 React Native 整洁架构实践
React-Native调试工具Redux调试DOM结构查看
redux的调试,除了最基本的打断点进去调试之外,还有一个好用的调试工具reactotron,它能够帮你清楚的记录你所发出的action,以及http请求,可以帮你更好的分析redux的结构。
贺贺V5
2018/08/21
2.9K0
React-Native调试工具Redux调试DOM结构查看
React Native程序调试
在做React Native开发时,少不了的需要对React Native程序进行调试。调试程序是每一位开发者的基本功,高效的调试不仅能提高开发效率,也能降低Bug率。 Developer Menu Android模拟器: 可以通过Command⌘ + M 快捷键来快速打开Developer Menu。也可以通过模拟器上的菜单键来打开。 iOS模拟器: 可以通过Command⌘ + D快捷键来快速打开Developer Menu。 在真机上开启Developer Menu: 在真机上你可以通过摇动手机来开启
xiangzhihong
2018/01/26
4K0
原来 React Native 已经如此成熟了
我有很丰富的 React Native 开发经验。但是由于接触它太早了,所以我跟它之间的恩怨是有点多的,曾经在各种场合吐槽了它无数次。主要是早期的版本坑确实多,开发体验并不是很友好,React Native 在国内社区的发展也并不是很好,要解决一个坑的成本非常高。
用户6901603
2024/07/12
5650
原来 React Native 已经如此成熟了
React-native,我们一起走过的坑。
前几个星期,点开了RN的技能树,废话不多说,那我就意简言赅地记录一下自己遇到的坑,避免后人再犯自己的错误。 先说明一下我的运行环境: 1.我当时这个年代用的RN版本是0.55 2.使用的脚手架是create-react-native-app
前端小哥哥
2023/05/04
1.1K0
React-native,我们一起走过的坑。
推荐阅读
相关推荐
React Native 开发工具推荐
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档