开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

计算最大矩形大小，任意旋转，以适应边界框

是一个计算几何问题，涉及到图形的旋转、边界框的计算和最大矩形的确定。

在计算几何中，最大矩形大小是指在给定的边界框内，能够旋转的矩形的最大面积。这个问题可以通过以下步骤来解决：

确定边界框的尺寸和位置：根据给定的边界框，确定其宽度、高度和位置信息。
构建旋转矩形：根据边界框的尺寸和位置信息，构建一个旋转矩形。旋转矩形是指可以在给定边界框内任意旋转的矩形。
计算旋转矩形的面积：根据旋转矩形的尺寸和形状，计算其面积。可以使用计算几何的方法来计算旋转矩形的面积。
寻找最大面积的旋转矩形：通过不断调整旋转矩形的尺寸和形状，寻找在给定边界框内面积最大的旋转矩形。
输出结果：将最大面积的旋转矩形的尺寸和形状信息输出。

在云计算领域，这个问题可以应用于图像处理、计算机视觉、自动驾驶等领域。例如，在自动驾驶中，可以通过计算最大矩形大小来确定车辆在边界框内的最大可行驶区域，从而进行路径规划和决策。

腾讯云提供了一系列与计算几何相关的产品和服务，例如：

腾讯云图像处理（Image Processing）：提供了图像处理的API和SDK，可以用于图像的旋转、裁剪、缩放等操作。详情请参考：腾讯云图像处理
腾讯云计算机视觉（Computer Vision）：提供了图像识别、人脸识别、物体检测等功能，可以用于处理与计算几何相关的问题。详情请参考：腾讯云计算机视觉
腾讯云人工智能（Artificial Intelligence）：提供了各种人工智能相关的服务和工具，可以用于解决复杂的计算几何问题。详情请参考：腾讯云人工智能

以上是关于计算最大矩形大小，任意旋转，以适应边界框的问题的一个简要回答，希望能对您有所帮助。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【文本检测与识别-白皮书-3.1】第一节：常用的文本检测与识别方法

此类方法通常是直接回归出水平矩形或者多方向的任意形状多边形以解决文本检测的问题。...pooling，RoI-Pooling)操作，增加了特征尺寸，然后在Fast R-CNN 中额外增加了一个分支预测旋转的矩形以及一个针对倾斜框的非极大值抑制后处理算法以解决多方向文本的检测问题。...作者提出了旋转候选区域生成网络(rotated region proposal network，RRPN)，结合旋转矩形的锚点框(anchor)来生成倾斜的文本候选区域。...He 等人(2017b)加入了文本注意力机制，通过强化文本部分的特征加强其分类和边界框回归，同时他们设计了一个多级特征融合模块以适应文本的尺度变化。...ORN 可以提取旋转的文本特征以适应不同方向的文本实例，然后在每个侧边连接提取特征后进行分类和边界框回归。

1.3K3 0

旋转目标检测 | Oriented RepPoints，基于点集表示的旋转目标检测模型

问题背景作者提到航拍图像中目标具有非水平，任意方向，密集分布，背景复杂等困难，主流的方法大多将其视为简单的旋转目标检测问题。...但是这种简单的转换函数只产生垂直-水平边界框，无法精确估计航拍图像中旋转物体的方位。...3.2 自适应方位点集学习为了将点集表示转换成旋转框表示，Oriented RepPoint引入了转换函数。...在文章中，作者测试了三种转换函数，分别是： MinAreaRect：点集的最小外接矩形构成边界框 NearestGTCorner：距离真值顶点最近的四个点构成边界框 ConvexHull：通过Jarvis...March算法，从点集中取能包含所有点的最大凸四边形作为边界框其中MinAreaRect不可微分，其他两个可微分，因此作者在推理时使用MinAreaRect，在训练时从NearestGTCorner

1.9K2 0

CTPN、TextBoxes、SegLink、RRPN、FTSN、DMPNet…你都掌握了吗？一文总结OCR必备经典模型（一）

检测过程中可能会遇到文字区域过长，超过了默认框的最大比例的问题，即使在anchor和卷积滤波器上进行优化，也仍然很难检测出极端纵横比和大小的文本。...，是一种基于旋转的自然场景图像任意文本检测框架，能够基于旋转的方法和一个端到端的文本检测系统来进行任意方向的文本检测。...RRPN为文本实例生成面向任意性的建议，并进一步对建议bounding box进行回归，以更好地适应文本实例。从RRPN分支出来的同级层是RRPN的分类层(cls)和回归层(reg)。...最后，将rois发送到检测、分段和框回归分支，以输出像素级别的文本实例及其对应的边界框bounding 波。后处理部分包括NMS和最小四边形生成。...传统的研究只集中在使用矩形边界框或水平滑动窗口来定位文本，这可能会导致冗余的背景噪声、不必要的重叠甚至信息损失。

4543 0

旋转目标检测 | R3Det，基于特征精炼的单阶段检测模型

问题背景作者称对于旋转目标检测存在三个挑战：大宽高比密集排列方向任意 3....，因此使用了这两种形式的框进行组合，具体做法是第一阶段检测水平框，从而提升检测速度，提高召回率，第二阶段也就是精炼阶段（refinement stage）检测旋转框，以适应密集目标的检测。...approximate SkewIoU loss：为解决Skew IoU计算不可微的问题，设计了一种近似SkewIoU损失，以获得更精确的旋转估计。...3.1 模型结构 R3Det主要基于 RetinaNet 实现，结构如下： 3.2 边界框定义对于边界框(x,y,w,h,\theta)，其中x，y代表中心点坐标，w，h代表宽和高，\theta \in...因此作者提出将当前精炼边界框(橙色矩形)的位置信息重新编码为对应的特征点(红色点)，从而以逐像素的方式重构整个特征图，实现特征对齐。整个过程如上图（c）所示。

2.9K1 0

计算机视觉 OpenCV Android | 基本特征检测之轮廓分析

（1）边界框最常见的获取轮廓的外接矩形是边界框，获取每个轮廓的边界框，通过它可以得到与各个轮廓相对应的高度与宽度，并能通过它计算出轮廓的纵横比。...调用该API会返回一个Rect对象实例，它是OpenCV关于矩形的数据结构，从中可以得到外界矩形（边界框）的宽高，然后就可以计算出轮廓的横纵比了。...（2）最小边界框与上面边界框不同的是，获取到的最小边界框有时候不是一个水平或者垂直的矩形，而是一个旋转了一定角度的矩形，但是最小外接矩形（最小边界框）能够更加真实地反映出轮廓的几何结构大小，...调用该API会返回一个RotatedRect对象实例，它是OpenCV关于旋转矩形的数据结构，其包含了旋转角度，矩形的宽、高及四个顶点等信息，通过相关的API都可以查询获得，绘制旋转矩形对象的时候...（3）面积与周长轮廓分析中包含了轮廓大小的度量，这些度量最常见的就是计算轮廓的面积大小与长度大小，这些数据对分析轮廓与过滤掉一些不符合条件的轮廓十分有用。

1.4K2 0

Unity Hololens2开发|（八）MRTK3空间操作 BoundsControl（边界控制）

1.前言 BoundsControl 提供自动调整大小的边界框，以及旋转和缩放的操作功能。...如果封闭对象的视觉形状不一定与碰撞体匹配，或者相反，开发人员可以调整计算方法以首选使用呈现器或碰撞器边界，或者同时使用这两者。无论计算方法如何， Padding 选项都将以世界单位统一填充边界。...RotateAnchor 指定旋转句柄是围绕对象的原点旋转，还是围绕其计算边界的中心旋转。 ScaleAnchor 指定刻度柄是围绕对角旋转刻度，还是围绕其计算边界的中心旋转刻度。...SmoothingActive 检查以启用帧速率独立平滑。 RotateLerpTime 输入表示要应用到旋转的平滑量。平滑0表示没有平滑。最大值意味着不改变值。...ScaleLerpTime 输入表示平滑量以应用于刻度。平滑0表示没有平滑。最大值意味着不改变值。 TranslateLerpTime 输入表示平滑量的Translate以应用于翻译。

2421 0

大盘点|OCR算法汇总

论文的主要思想为旋转区域提案网络（RRPN），该网络旨在生成带有文本方向角度信息的倾斜proposal，并将角度信息用于边界框回归，以使proposal在方向方面更准确地适合文本区域。...除此之外，还提出了旋转兴趣区域（RRoI）池化层，以将任意方向的proposal投影到feature map上供分类器进行分类。...2、提出了改进任意方向区域建议的新策略，以提高任意方向文本检测的性能。...2、提出了唯一确定任意平面凸四边形中4个点顺序的协议，使得该方法能够使用相对回归来预测四边形边界框。...最后，应用一个迭代包围盒投票方案来追求高以互补的方式回忆并引入过滤算法以保留最合适的边界框，同时为每个文本实例移除多余的内部和外部框。

2.4K1 0

ODTK：来自NVIDIA的旋转框物体检测工具箱

轴对齐框(a)包含了很多天空。旋转框(b)更适合例如，尝试使用四个边界框参数来描述一个旋转了45度的正方形。边界框的面积是你试图描述的正方形面积的两倍。自己计算一下吧！...对于矩形物体，或者任何高长宽比的物体(又高又瘦，又矮又胖)，差别甚至更大。因此，需要一个额外的参数来减少目标的面积和描述它的边界框之间的差异，物体相对于垂直轴的角度，θ 。...对于轴对齐框，IoU计算非常简单，可以使用NVIDIA GPU以端到端方式加速。...图4，轴对齐锚框(蓝色)，旋转的锚框(红色和蓝色)，旋转角度：-π/6, 0和π/6 旋转框的IOU计算 ? 图5，两个旋转矩形的重叠区域为多边形。...图7，首先创建一个轴对齐的框(左)，然后旋转(右)来构造边界框许多数据集(例如COCO和ISPRS)都带有分割掩码。这些掩码可以转换为旋转框。

2.9K3 0

技术分享 | 遥感影像中的旋转目标检测系列(一)

角度的直接回归会导致两个问题：一是角度周期性导致的边界不连续；另一个是角度（以弧度为单位）和目标框尺寸（以像素为单位）之间的单位不匹配。...与 O2DETR 直接回归角度不同，我们提出的方案是，为每个旋转框预测一组点，预测的这组点的最小外接矩形框将用来表示待预测的旋转目标。...点的学习更加灵活，并且一组点的分布可以反映目标旋转框的角度和框的大小。...点集的学习更灵活，并且预测的点集的分布能够表示待预测的旋转目标框的位置、角度和大小。...在推理时，对每个query,我们将预测的点集通过OpenCV的minAreaRect函数转为旋转矩形框（也即点集的最小外接矩形框）。

1.7K1 0

EAST算法超详细源码解析：数据预处理与标签生成

02 is_cross_text：判断裁剪有无“割裂”图像中的任意文本框 is_cross_text(i) 生成裁剪后图像的多边形区域以及文本框的多边形区域，计算两者的重叠区域面积。...注意，只要图像中有任意一个文本框不完全处于裁剪后的图像内部，则该裁剪方案不符合要求！...，那么放大回去，有可能会引入文本框边界以外的点，会引入假正例。...此处是通过枚举的方式，对于在 [ ] 范围内的每个角度，都将文本框进行对应的旋转，旋转后记录对应的外接矩形面积，文本框和前10个面积最小的外接矩形的拟合误差，最终选取误差最小的那个方案对应的旋转角。...、v3、v4是文本框4个顶点，文本框与水平轴的真实夹角是，假设我们在枚举过程中遇到一角度，然后将文本框进行对应旋转，旋转后的外接矩形就是上图右上部分的ABCD，阴影部分就是外接矩形比文本框多出来的面积

2K3 0

EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗？一文总结OCR必备经典模型（二）

（该函数是输出包围点集的最小矩形，该矩形可以是旋转的）。...文本框层的每个位置预测每个默认框的n维向量，包括文本存在分数（2维）、水平边界矩形偏移量（4维）和旋转矩形边界框偏移量（5维）或四边形bounding box偏移量（8维）。...在测试阶段应用非最大抑制，以合并所有6个文本框层的结果。"...bounding box和包含对应旋转矩形的最小外接矩形。...首先，文本多边形G以相同的偏移量D对Gd进行扩张。把G_s和G_d之间的空隙视为文本区域的边界，在这里，阈值图的标签可以通过计算与G中最近的片段的距离来生成。

8713 1

AAAI 2021中的目标检测（详细版with code）

现在流行的旋转检测方法通常使用五个参数（中心点坐标xy，宽度，高度和旋转角度）来描述旋转的边界框，并将l1损失描述为损失函数。...特征精炼模块的关键思想是通过特征插值将当前精炼的边界框位置信息重新编码为对应的特征点，以实现特征重构和对齐。...因此，在本文精炼的单级检测器中使用两种形式的锚框进行组合，即在第一阶段使用水平锚框以提高速度和产生更多候选框。然后在精炼阶段去使用旋转锚框以适应目标密集场景。...将精炼阶段(可以多次添加和重复)添加到网络以精炼边界框，并在精炼阶段添加特征精炼模块(FRM)以重建特征图。...本文提出将当前精炼的边界框(橙色矩形)的位置信息重新编码为相应的特征点(红色的点)，然后通过重建整个特征图来实现特征对齐。

1.6K1 0

谷歌公布亚毫秒级人脸检测算法 BlazeFace，人脸检测又一突破！

除了预测轴对齐的面部矩形外，BlazeFace 模型还生成了 6 个面部关键点坐标（用于眼睛中心、耳、嘴中心和鼻尖），以便我们估计面部旋转角度（滚动角度）。...这样的设置使其能够将旋转的面部矩形传递到视频处理流程的后期任务特定阶段，从而减轻后续处理步骤对重要平移和旋转不变性的要求。...图 2 BlazeFace 特征提取器的网络结构 3、Anchor 机制类似 SSD 的目标检测模型依赖于预定义的固定大小的基础边界框，称为先验机制，或 Faster-R-CNN 术语中的锚点。...它们用于将预定义的锚位置调整为紧密的边界矩形。通常的做法是根据目标比例范围在多个分辨率级别定义锚点，同时下采样也是计算资源优化的手段。...为了最小化这种现象，我们用一种混合策略代替抑制算法，该策略以重叠预测之间的加权平均值估计边界框的回归参数，它几乎不会产生给原来的 NMS 算法带来额外成本。

1.2K2 0

80.73mAP、38.5mAP，旋转框、小目标检测能力双SOTA！

由于物体本身与图像坐标轴具有大小不一的倾斜角，使用旋转框描述物体相比于使用水平框描述物体包含更少的背景，定位更加精细。旋转框检测常用于遥感影像分析、机器人抓取、自动驾驶、场景文字检测等场景当中。...针对此情况，我们从先进的水平框检测算法PP-YOLOE+入手，对其进行了改进，以极少的参数量和计算量取得了极佳的效果。...首先，我们利用点与旋转矩形框的几何性质判断点是否在矩形框内部，来筛选Anchor Points。其次，我们计算了预测的旋转矩形框与GT框的旋转IoU，加入metric的计算中。...在推理时，我们可以将其与卷积层一起重参数化，因此推理时的参数量和计算量都不变。 ProbIoU损失函数将旋转矩形框建模成高斯框已经成为一个流行的做法。...在回归距离时，用softmax将网络输出转换为概率，计算在[0, ... , reg_max]上的概率和，表示在当前特征图上中心点到目标框四边距离，其最大值应为reg_max，结果乘以步长就可以映射回输入图尺寸上

1.5K5 0

谷歌公布亚毫秒级人脸检测算法 BlazeFace，人脸检测又一突破！

除了预测轴对齐的面部矩形外，BlazeFace 模型还生成了 6 个面部关键点坐标（用于眼睛中心、耳、嘴中心和鼻尖），以便我们估计面部旋转角度（滚动角度）。...这样的设置使其能够将旋转的面部矩形传递到视频处理流程的后期任务特定阶段，从而减轻后续处理步骤对重要平移和旋转不变性的要求。...图 2 BlazeFace 特征提取器的网络结构 3、Anchor 机制类似 SSD 的目标检测模型依赖于预定义的固定大小的基础边界框，称为先验机制，或 Faster-R-CNN 术语中的锚点。...它们用于将预定义的锚位置调整为紧密的边界矩形。通常的做法是根据目标比例范围在多个分辨率级别定义锚点，同时下采样也是计算资源优化的手段。...为了最小化这种现象，我们用一种混合策略代替抑制算法，该策略以重叠预测之间的加权平均值估计边界框的回归参数，它几乎不会产生给原来的 NMS 算法带来额外成本。

1.2K4 0

CVPR 2018 | 华中科技大学提出多向文本检测方法：基于角定位与区域分割

与一般目标检测相比，场景文本检测更加复杂，因为：1）场景文本可能以任意方向存在于自然图像中，因此边界框可能是旋转的矩形或者四边形；2）场景文本边界框的长宽比变化比较大；3）因为场景文本的形式可能是字符、...子二个分支以语义分割为基础，例如 [52] 和 [50]，它们生成分割映射，然后通过后处理生成最终的文本边界框。...新研究的动机主要来源于两方面的观察：1）不管矩形的大小如何、长宽比如何、方向如何，它都可以由角点决定；2）区域分割图可以提供有效的文本位置信息。...最后，我们再通过角点进行采样和分组，以生成候选边界框，并通过分割信息消除不合理的边框。新的方法的处理流程如图 2 所示： ? 图 2. 方法概览。...( 2 ) 在位置敏感 ROI 池化 [ 9] 的基础上，提出了一种旋转的位置敏感 ROI 平均池化层，可以处理任意方向的请求。

1.2K6 0

BBAVectors：一种Anchor Free的旋转物体检测方法

（3）第二个阶段的crop和regress策略在计算量上也比较大。...来将CenterNet扩展到有方向的物体检测，但是，对于任意的旋转物体，宽和高实际上依赖于不同的旋转坐标系统，所以直接回归会有些难度。...Groundtruth 假设c=（cx,cy）是旋转框的中心点，我们以c为中心，构建一个2D的高斯分布来作为热图的groundtruth，其中，高斯分布的方差是和物体的尺寸相关的一个自适应的值。...2.5 方向我们发现，当物体框和xy轴对齐的时候，检测会失败，这个原因可能是象限的边界问题，这种类型的向量的差别很难区分。...另外，外接矩形的参数也可以帮助我们去更好的描述OBB。我们定义了一个旋转特征图α，我们这样定义： ? 然后通过交叉熵来优化： ? 3.

2.2K4 0

我做了一个在线白板（二）

先来看(x1,y1)：图片首先我们可以使用Math.atan2函数计算出线段和水平线的夹角A，atan2函数可以计算任意一个点（x, y）和原点（0, 0）的连线与X轴正半轴的夹角大小，我们可以把线段的...，计算当前速度相对于最大速度的比值，乘以最大宽度，因为速度和宽度是成反比的，所以用最大宽度相减计算出该速度对应的宽度。...当绘制新文字时，创建一个无边框无背景的input元素，通过固定定位显示在鼠标所点击的位置，然后自动获取焦点，监听输入事件，实时计算输入的文字大小动态更新文本框的宽高，达到可以一直输入的效果，当失去焦点时隐藏文本框...根据矩形的中心点计算鼠标拖动的角的对角点坐标，比如我们拖动的是矩形的右下角，那么对角点就是左上角； 2.根据鼠标拖动到的实时位置结合对角点坐标，计算出新矩形的中心点坐标； 3.获取鼠标实时坐标经新的中心点反向旋转原始矩形的旋转角度后的坐标...根据之前的逻辑，我们是可以计算出绿色矩形未旋转前的位置和宽高的，那么新的比例也可以计算出来，再根据原始矩形的宽高比例，我们可以计算出红色矩形未旋转前的位置和宽高：图片如图所示，我们先计算出实时拖动后的绿色矩形未旋转时的位置和宽高

1.4K3 0

OpenCV-Python速查：从载入图片到人脸识别

模糊/平滑：Blurring/Smoothing 绘制矩形/边界框画线在图片上写入文字人脸识别轮廓(Contours)——一种物体检测的方法保存图像安装方式有两种：Window用户，Linux...提醒2：按下任意按键，来关闭显示图像的窗口。...在图像：image[10:500, 500:2000] 中以(y, x)为起点，裁剪大小为(h, w)的图像： image[y:y+h, x:x+w] 调整大小：Resizing ?...当保留为0时，他们将根据内核大小自动计算更多的模糊函数，参看原文。在图像上绘制矩形/边界框 ? ? 上方: 图像来自Pexels....下方: 狗狗脸上画了一个矩形框 import cv2 output = image.copy() cv2.rectangle(output, (2600, 800), (4100, 2400), (0,

2.5K3 0

腾讯数平精准推荐 | OCR技术之检测篇

我们在物体检测技术架构的基础上，将角度信息融入到检测框架中，目的在于回归任意方向的文本框。...、任意宽高比或尺寸的候选旋框投影到固定大小的特征图，解决了传统RoI池化层只能处理轴对齐候选框的问题；传统的非极大值抑制（NMS，Non Maximum Suppression）算法只能处理轴对齐的候选框...基于CTPN方法[10]的基本思想，通过在卷积网络的特征图上提取Anchors，并计算每个Anchor的得分,并在计算得分的过程中，综合利用上下文信息、每行的文本序列特性，采用RNN进行建模以判断文字的得分...Regression）的方式对场景文字进行检测，直接产生单词或文本行级别的预测（旋转矩形或任意四边形），通过非极大值抑制产生最终结果。...图7 基于FCN的文本检测网络结构图我们设计了基于FCN的文本检测方法，文本检测网络（如图7所示）产生两种输出：Score Map和文本边界框的回归结果（回归目标为矩形时是5自由度的坐标和角度、回归任意四边形时是

10.1K12 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭