首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >YOLO11旋转目标识别(OBB)手把手教程: 如何训练自己的数据集(QR码为案列)

YOLO11旋转目标识别(OBB)手把手教程: 如何训练自己的数据集(QR码为案列)

原创
作者头像
AI小怪兽
发布于 2024-11-06 01:18:52
发布于 2024-11-06 01:18:52
3.6K00
代码可运行
举报
文章被收录于专栏:毕业设计毕业设计YOLO大作战
运行总次数:0
代码可运行

💡💡💡本文内容:YOLO11 OBB实现自有数据集缺陷旋转目标检测,从1)数据标记;2)数据json格式转换成适合yolo的txt格式;3)如何训练模型;

1.YOLO11介绍

Ultralytics YOLO11是一款尖端的、最先进的模型,它在之前YOLO版本成功的基础上进行了构建,并引入了新功能和改进,以进一步提升性能和灵活性。YOLO11设计快速、准确且易于使用,使其成为各种物体检测和跟踪、实例分割、图像分类以及姿态估计任务的绝佳选择。

OBB官方在 (DOTAv1)数据集上做了更多测试:

2. OBB旋转目标介绍

YOLO OBB格式通过四个角点指定边界框,坐标在0到1之间归一化。它遵循以下格式:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class_index, x1, y1, x2, y2, x3, y3, x4, y4

在内部,YOLO以xywhr格式处理损失和输出,xywhr格式表示边界框的中心点(xy)、宽度、高度和旋转。

2.1 labelme下载

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装labelme
pip install labelme

2.2使用labelme下

直接在python环境下运行

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
labelme

2.3 labelme介绍

1)Create Polygons生成polygon框;

3.QR码 旋转数据集介绍

训练集、验证集、测试集分别为:1894,100,101张

3.1 obb生成适合yolo格式的txt

obb_json_to_txt

YOLO11旋转目标识别(OBB)手把手教程: 数据集标注 | 数据格式转换 | 如何训练、测试-CSDN博客

4.OBB旋转目标训练

下载最新版即可,已支持OBB

GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite

4.1 qrcode-obb.yaml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
path: D:/ultralytics-11/data/qrcode-obb/ 
train: train/images
val: valid/images
test: test/images

names: 
  0: qr_code

4.2 如何训练

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
    model = YOLO('ultralytics/cfg/models/11/yolo11-obb.yaml')
    #model.load('yolov11.pt') # loading pretrain weights
    model.train(data='data/qrcode-obb.yaml',
                cache=False,
                imgsz=640,
                epochs=200,
                batch=16,
                close_mosaic=10,
                device='0',
                optimizer='SGD', # using SGD
                project='runs/train',
                name='exp',
                )

4.3训练结果可视化

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
YOLO11-obb summary (fused): 300 layers, 2,897,630 parameters, 0 gradients, 6.6 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 7/7 [00:04<00:00,  1.53it/s]
                   all         99        128      0.953      0.955      0.966      0.908

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验