3D点云目标跟踪是自动驾驶、机器人等领域的关键任务,但不同类别物体的几何差异让模型难以“一招通吃”。本文介绍的 TrackAny3D,首次提出将大规模预训练3D...
这篇论文针对的是无人机航拍图像中的小目标检测这一极具挑战性的任务。无人机视角下的目标通常像素占比极小、尺度多变且背景复杂,导致主流检测模型性能显著下降。为此,作...
在冬季计算机视觉应用会议(WACV)上,提出了一种新的多图像聚合嵌入方法,显著提升了多模态AI任务的性能。研究团队对比了四种图像融合方法:元素级平均嵌入、最大池...
在深度学习的原始叙述中,每个神经元通过组合前一层特征来逐步构建更抽象、有意义的特征。近年来,这种观点受到了一些质疑,但如果我们认真对待它会发生什么?
本文将介绍OpenAI开发的标志性模型之一——CLIP。该模型于2021年发布,可应用于多种自然语言处理或计算机视觉项目,并在不同任务中实现领先性能。虽然许多工...
本文提出了一种融合高效局部注意力(ELA)模块和SIoU损失函数的YOLOv8改进模型YOLO-ELA,在无人机绝缘子缺陷检测任务中以96.9%的mAP和74....
随着该领域人员短缺和工作量增加(更不用说疫情带来的患者负荷),放射科医生和医师都承受着巨大压力。Ding思考机器学习和计算机视觉是否能提供帮助。
单目 3D 目标检测是计算机视觉领域的热门研究方向,但如何在真实复杂场景中识别“未见过”的物体,一直是个难题。本文介绍的 3D-MOOD 框架,首次提出端到端的...
传统电力巡检又慢又累还看漏,AI+无人机如何搞定? 这篇论文提出了一个基于前沿YOLOv8的实时检测框架,不仅能用无人机一眼精准锁定细如发丝的电力线,还能当场算...
YOLO11 延续了 YOLO 系列以 CNN 为核心、高度优化的传统,通过架构和训练方法的渐进式改进,持续提升检测效率与精度。YOLOv12 则转向以注意力机...
YOLO系列长期统治着实时目标检测,但Transformer能否取而代之一直是悬而未决的问题。百度最新提出的LW-DETR(Light-Weight DETR)...
过去五年,无人机技术的角色发生了深刻转变——它们已不再是单纯的航拍设备,而是逐渐演化为 能源巡检的前哨、农业生产的“新农具”、物流网络的空中节点、应急救援的先遣...
2023年某中心与马克斯·普朗克学会(简称MPG)共同资助了四个探索人工智能与时尚交叉领域的研究项目。这些项目聚焦于计算机视觉和机器学习技术的创新应用。
随着人工智能技术的飞速发展,对计算能力的需求也在急剧增长。尽管传统经典神经网络在图像识别、自然语言处理等领域取得了巨大成功,但在处理指数级规模数据或高度复杂的纠...
无人机光伏巡检如何更智能、更高效?HOTSPOT-YOLO模型给出了亮眼答案!给AI装上“热成像鹰眼”,能精准锁定光伏板上的细微热斑缺陷。它不仅将检测精度(mA...
异常检测是预测产品是否偏离常态,表明可能存在缺陷;异常定位是更复杂的任务,需使用像素级异常分数来突出异常区域。尽管计算机视觉取得了进展,但研究与异常定位方法在实...
异常检测是预测产品是否偏离常态(表明可能存在缺陷);异常定位则是更复杂的任务,需使用像素级异常分数来突出异常区域。尽管计算机视觉技术不断进步,但异常定位方法的研...
背景: 在当今数字时代,博客成为了分享知识、展示个人专业能力和吸引读者的重要工具。然而,随着越来越多的博客涌现,如何优化博客的内容和用户体验成为了一个关键的问...
2025 年,具身智能(Embodied Intelligence)毫无疑问已经成为全球资本追逐的“风口赛道”。从人形机器人、无人配送,到低空经济和智能驾驶,几...
进入 2025 年下半年,中国科技产业的主旋律已经从“探索可能”转向“加速落地”。AI 大模型与算力基础设施持续突破,人形机器人与低空经济迈入量产阶段,智能驾驶...