首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深度学习理论篇之 ( 十一) -- 卷积神经网络之风云盛世(三)

    计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

    02

    YOLOv8损失函数改进:MPDIoU新型边界框相似度度量,效果秒杀GIoU 、 DIoU 、CIoU 、 EIoU等 | ELSEVIER 2023

    摘要:边界框回归(BBR)已广泛应用于对象检测和实例分割,是对象定位的重要步骤。 然而,当预测框与真实框具有相同的长宽比,但宽度和高度值完全不同时,大多数现有的边界框回归损失函数无法优化。 为了解决上述问题,我们充分挖掘水平矩形的几何特征,提出了一种基于最小点距离的新型边界框相似度比较度量MPDIoU,它包含了现有损失函数中考虑的所有相关因素,即重叠 或非重叠区域、中心点距离、宽高偏差,同时简化计算过程。 在此基础上,我们提出了一种基于 MPDIoU 的边界框回归损失函数,称为 LMPDIoU 。 实验结果表明,MPDIoU 损失函数适用于在 PASCAL VOC、MS COCO 和 IIIT5k 上训练的最先进的实例分割(例如 YOLACT)和对象检测(例如 YOLOv7)模型优于现有的损失函数。

    03
    领券