Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >YOLOv8最新版本支持SAM分割一切

YOLOv8最新版本支持SAM分割一切

作者头像
OpenCV学堂
发布于 2023-08-22 05:17:18
发布于 2023-08-22 05:17:18
1.7K04
代码可运行
举报
运行总次数:4
代码可运行

微信公众号:OpenCV开发者联盟 关注获取更多计算机视觉深度学习知识

SAM概述

分割任何模型 (Segment Anything Model - SAM) 是一种突破性的图像分割模型,可实现具有实时性能的快速分割。它构成了 Segment Anything 项目的基础,该项目引入了用于图像分割的新任务、模型和数据集。SAM 被设计为可提示的,允许它将零样本转移到新的图像分布和任务。该模型在 SA-1B 数据集上进行训练,该数据集在许可和尊重隐私的一千一百万张图像上包含超过 11 亿个蒙版。SAM展示了令人印象深刻的零样本分割性能,常规场合超过之前监督学习的结果。

主要特点

01

提示分段任务:

SAM 专为可提示的分割任务而设计,使其能够在给定任何分割提示(例如标识对象的空间或文本信息)的情况下返回有效的分割掩码。

02

高级架构:

SAM 利用强大的图像编码器、提示编码器和轻量级掩码解码器。这种架构在分割中实现了灵活的提示、实时掩码计算和模糊感知。

03

SA-1B 数据集:

Segment Anything项目引入了SA-1B数据集,该数据集包含1000多万张图像上的11亿多个掩码。该数据集是迄今为止最大的分割数据集,为 SAM 提供了用于训练的多样化和大规模数据源。

04

零样本性能:

SAM 在一系列分割任务中表现出卓越的零样本性能,开箱即用,可针对各种应用进行快速工程设计。

SAM 可用于各种视觉场景下游任务,涉及训练数据之外的对象和图像分布。包括边缘检测、对象推荐生成、实例分割和初级文本到掩码预测。通过采用提示工程,SAM可以零样本的方式适应新任务和数据分布,使其成为图像分割任务的多功能和强大工具。

YOLOv8中使用SAM模型

当前YOLOv8支持两种SAM模型,分别是base与large版本SAM模型。以base模型为例,基于YOLOv8框架,SAM实现推理图像分割一切得代码只需要如下几行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from ultralytics import SAM
import cv2 as cv

model = SAM('sam_b.pt')
model.info()  # display model information
result = model.predict("D:/bird_test/master.jpg")

运行结果显示如下:

基于YOLOv8对象检测模型,实现自动语义分割模型的标注:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from ultralytics.yolo.data.annotator import auto_annotate
auto_annotate(data="path/to/images", det_model="yolov8x.pt", sam_model='sam_b.pt')

两行代码即可实现自动实例分割标注,从此爱上标注数据这个活!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
SAM2(Segment Anything Model 2)新一代分割一切大模型实战总结
Segment Anything Model 2(SAM 2)作为Meta公司发布的Segment Anything Model(SAM)的升级版本,在图像和视频分割领域展现出了显著的优点和特性。
AI浩
2024/10/22
2.2K0
SAM2(Segment Anything Model 2)新一代分割一切大模型实战总结
实战 | 基于YOLOv9+SAM实现动态目标检测和分割(步骤 + 代码)
本文主要介绍基于YOLOv9+SAM实现动态目标检测和分割,并给出详细步骤和代码。
Color Space
2024/04/12
2.7K0
实战 | 基于YOLOv9+SAM实现动态目标检测和分割(步骤 + 代码)
中国提出的分割天花板 | 精度相当,速度提升50倍!
论文地址:https://arxiv.org/pdf/2306.12156v1.pdf
计算机视觉研究院
2023/08/23
3850
中国提出的分割天花板 | 精度相当,速度提升50倍!
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
机器之心报道 机器之心编辑部 CV 研究者接下来的路要怎么走? 「这下 CV 是真不存在了。< 快跑 >」这是知乎网友对于一篇 Meta 新论文的评价。 如标题所述,这篇论文只做了一件事情:(零样本)分割一切。类似 GPT-4 已经做到的「回答一切」。 Meta 表示,这是第一个致力于图像分割的基础模型。自此,CV 也走上了「做一个统一某个(某些?全部?)任务的全能模型」的道路。 在此之前,分割作为计算机视觉的核心任务,已经得到广泛应用。但是,为特定任务创建准确的分割模型通常需要技术专家进行高度专业化
机器之心
2023/04/06
3420
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
CV -- YOLOv8 图像分割(GPU环境)
https://download.csdn.net/download/2403_83182682/90405543?spm=1001.2014.3001.5503
用户11404404
2025/02/20
2020
CV -- YOLOv8 图像分割(GPU环境)
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA
机器之心报道 编辑:小舟、陈萍 YOLOv8 抛弃了前几代模型的 Anchor-Base。 YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来,领域内的研究者们已经对 YOLO 进行了多次更新迭代,模型性能越来越强大。现在,YOLOv8 已正式发布。 YOLOv8 是由小型初创公司 Ultralytics 创建并维护的,值得注意的是 YOLOv5 也是由该公司创建的。 YOLOv8 项目地址:https://g
机器之心
2023/03/29
7.5K0
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA
Meta发布分割大模型[Segment Anything]CV的GPT时刻来临?
如标题所述,这篇论文只做了一件事情:(零样本)分割一切。类似 GPT-4 已经做到的「回答一切」。
AiCharm
2023/05/15
2970
Meta发布分割大模型[Segment Anything]CV的GPT时刻来临?
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
---- 新智元报道   编辑:编辑部 【新智元导读】今天,Meta发布史上首个图像分割基础模型SAM,将NLP领域的prompt范式引进CV,让模型可以通过prompt一键抠图。网友直呼:CV不存在了! 就在刚刚,Meta AI发布了Segment Anything Model(SAM)——第一个图像分割基础模型。 SAM能从照片或视频中对任意对象实现一键分割,并且能够零样本迁移到其他任务。 整体而言,SAM遵循了基础模型的思路: 1. 一种非常简单但可扩展的架构,可以处理多模态提示:文本、关键点
新智元
2023/04/06
9180
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
万能分割神器——Segment Anything(Meta AI)图片和影像的万能分割
想必大家之前都做过抠图或者图片任务提取等任务,这有点想目前我们手机当中可以直接点击图片,然后将其复制到其它地方,就会自动出现这个任务图像一样。这里我们可以直接登录这个网站去尝试一下这个图像分割的魅力Segment Anything | Meta AI
此星光明
2024/02/11
9640
万能分割神器——Segment Anything(Meta AI)图片和影像的万能分割
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
视频分割是自动驾驶、机器人技术、视频编辑等应用场景的基础技术,但目前的方法在零样本学习设置下,或是预测未见过的样本时,会出现性能不一致等问题。
新智元
2023/08/07
5290
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
实战 | 使用YOLOv8图像分割实现路面坑洞检测(步骤 + 代码)
如上图所示,现实生活中路面坑洞对车辆和驾驶员安全来说存在巨大隐患,本文将介绍如何使用YoloV8图像分割技术来检测路面坑洞,从而提示驾驶员注意避让,尽可能保证安全。
Color Space
2024/03/02
1.4K0
实战 | 使用YOLOv8图像分割实现路面坑洞检测(步骤 + 代码)
小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
对于 2023 年的计算机视觉领域来说,「分割一切」(Segment Anything Model)是备受关注的一项研究进展。
OpenCV学堂
2023/12/11
8140
小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
「分割一切」视频版来了:点几下鼠标,动态的人、物就圈出来了
视频分割在许多场景下被广泛应用。电影视觉效果的增强、自动驾驶的理解场景,以及视频会议中创建虚拟背景等等都需要应用到视频分割。近期,基于深度学习的视频分割已经有着不错的表现了,但这依旧是计算机视觉中一个具有挑战性的话题。
机器之心
2023/08/07
3070
「分割一切」视频版来了:点几下鼠标,动态的人、物就圈出来了
YOLOv8 深度解析!一文看懂,快速上手实操(附实践代码)
开源地址:https://github.com/ultralytics/ultralytics
计算机视觉研究院
2023/08/24
27.6K0
YOLOv8 深度解析!一文看懂,快速上手实操(附实践代码)
CV 迎来 GPT-3 时刻,Meta 开源万物可分割 AI 模型和 1100 万张照片,1B+掩码数据集!
CV 迎来 GPT-3 时刻,开启一键分割万物模式! 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 通过单击、交互式点击即可分割图像或视频。 英伟达 AI 科学家 Jim Fan 在 Twitter 上惊呼,Meta 发布的 SAM 让计算机视觉(CV)迎来 GPT-3 时刻。更不可思议的是,模型和数据(1100万张图像,10亿个掩码)都已经基于 Apache 2.0 许可开源。 今日,Meta 发布首个可“任意图像分割”的基础模型  Segment-Anything Model(S
AI科技大本营
2023/04/10
7720
CV 迎来 GPT-3 时刻,Meta 开源万物可分割 AI 模型和 1100 万张照片,1B+掩码数据集!
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分割基础模型。
机器之心
2024/04/12
2250
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
YoloV8实战:使用YoloV8实现OBB框检测
使用定向边界框(OBB)训练精确的物体检测模型需要一个全面的数据集。本文解释了与Ultralytics YOLO 模型兼容的各种 OBB 数据集格式,深入介绍了这些格式的结构、应用和格式转换方法。数据集使用DOTA。
AI浩
2024/10/22
1.2K0
YoloV8实战:使用YoloV8实现OBB框检测
Segment Anything笔记 - plus studio
Segment Anything project是一个用于图像分割的新任务、模型和数据集。在他刚出来的那一天,知乎等平台就已经高呼CV已死。为了这个项目,作者创建了迄今为止最大的分割数据集,1100万张在10亿次授权且尊重隐私的图像上的数据集。模型也被设计和训练成了promptable,就是说可以给他一些提示。作者在多个数据集测试了他的结果并认为结果令人满意。
plus sign
2024/02/28
3750
Segment Anything笔记 - plus studio
【人工智能】Transformers之Pipeline(二十七):蒙版生成(mask-generation)
pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks)。共计覆盖32万个模型
LDG_AGI
2024/12/11
2150
【人工智能】Transformers之Pipeline(二十七):蒙版生成(mask-generation)
基础模型还是微调? 河流污染少镜头语义分割的评价
近年来,基础模型(FMs)已成为人工智能(AI)研究的热点领域。它们以能够轻易地泛化到新领域和任务的能力而著称,为研究和产业都带来了令人激动的机会。但是,从产业角度来看,FMs只有在它们在给定任务上超越专门为此任务训练的模型时才更有效。因为实际生活中的数据往往与用于研究的数据存在显著差异,因此在行业环境中预训练的数据集可能无法匹配当前的任务。因此,FMs或对现有模型进行微调是合理的选择,虽然在某些情况下选择并不明显。微调模型被认为需要大量的优质数据进行训练,而工业环境中获取这些数据并不容易。在这种情况下,FMs可能是解决方法。在本工作中,作者研究了一个人是否应该使用FMs而不是微调现有的模型。
未来先知
2024/10/29
1450
基础模型还是微调? 河流污染少镜头语义分割的评价
推荐阅读
SAM2(Segment Anything Model 2)新一代分割一切大模型实战总结
2.2K0
实战 | 基于YOLOv9+SAM实现动态目标检测和分割(步骤 + 代码)
2.7K0
中国提出的分割天花板 | 精度相当,速度提升50倍!
3850
CV不存在了?Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻
3420
CV -- YOLOv8 图像分割(GPU环境)
2020
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA
7.5K0
Meta发布分割大模型[Segment Anything]CV的GPT时刻来临?
2970
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
9180
万能分割神器——Segment Anything(Meta AI)图片和影像的万能分割
9640
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
5290
实战 | 使用YOLOv8图像分割实现路面坑洞检测(步骤 + 代码)
1.4K0
小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
8140
「分割一切」视频版来了:点几下鼠标,动态的人、物就圈出来了
3070
YOLOv8 深度解析!一文看懂,快速上手实操(附实践代码)
27.6K0
CV 迎来 GPT-3 时刻,Meta 开源万物可分割 AI 模型和 1100 万张照片,1B+掩码数据集!
7720
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
2250
YoloV8实战:使用YoloV8实现OBB框检测
1.2K0
Segment Anything笔记 - plus studio
3750
【人工智能】Transformers之Pipeline(二十七):蒙版生成(mask-generation)
2150
基础模型还是微调? 河流污染少镜头语义分割的评价
1450
相关推荐
SAM2(Segment Anything Model 2)新一代分割一切大模型实战总结
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验