如何在目标检测API中使用GCP视觉训练模型_如何在tensorflow对象检测api中使用Image net上的预训练模型 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

精确率提升7.8%！首个多模态开放世界检测大模型MQ-Det登NeurIPS 2023

目前的开放世界目标检测模型大多遵循文本查询的模式，即利用类别文本描述在目标图像中查询潜在目标，但这种方式往往会面临「广而不精」的问题。

02

NeurIPS 2023 | MQ-Det: 首个支持多模态查询的开放世界目标检测大模型

本文为粉丝投稿，分享 NeurIPS 2023 论文Multi-modal Queried Object Detection in the Wild，介绍首个支持多模态查询的开放世界目标检测大模型。

03

您找到你想要的搜索结果了吗？

是的

没有找到

怎样在树莓派上轻松实现深度学习目标检测？

这个现实世界造成了很多挑战，比如数据有限、只有微型的计算机硬件（像手机、树莓派）所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车，冰箱里的橘子，文件上的签名和太空中的特斯拉。

03

名声大噪的YOLO迎来YOLOv8，迅速包揽目标检测、实例分割新SOTA

机器之心报道编辑：小舟、陈萍 YOLOv8 抛弃了前几代模型的 Anchor-Base。 YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研究者们已经对 YOLO 进行了多次更新迭代，模型性能越来越强大。现在，YOLOv8 已正式发布。 YOLOv8 是由小型初创公司 Ultralytics 创建并维护的，值得注意的是 YOLOv5 也是由该公司创建的。 YOLOv8 项目地址：https://g

02

实战指南：使用OpenCV 4.0+Python进行机器学习与计算机视觉

计算机视觉和机器学习的融合为我们带来了前所未有的机会和挑战。从智能助手到自动驾驶，OpenCV 4.0+Python提供了强大的工具来实现各种应用。本文将带您深入探索如何在实际项目中应用这些技术，为您打开计算机视觉与机器学习的大门。

03

华为诺亚调研200多篇文献，视觉Transformer综述入选TPAMI 2022

机器之心专栏华为诺亚方舟实验室华为诺亚方舟实验室联合北大和悉大整理了业界第一篇视觉Transformer综述。 2021 年对计算机视觉来说是非常重要的一年，各个任务的 SOTA 不断被刷新。这么多种 Vision Transformer 模型，到底该选哪一个？新手入坑该选哪个方向？华为诺亚方舟实验室的这一篇综述或许能给大家带来帮助。综述论文链接：https://ieeexplore.ieee.org/document/9716741/ 诺亚开源模型：https://github.com/huawe

02

【学术】无人零售背后的秘密：使用Tensorflow目标检测API实现更智能的零售结账

我一直在使用Tensorflow目标检测API，并对这些模型的强大程度感到惊讶。我想要分享一些API实际使用案例的性能。 Tensorflow目标检测API地址： https://github.com/tensorflow/models/tree/master/research/object_detection 第一个使用案例是更智能的零售结账体验。Amazon Go商店宣布后，这是一个热门领域。为商店设计智能货架，追踪顾客从货架挑选的东西。我通过构建两个目标检测模型来做到这一点 — 一个的追踪手，用来追

09

业界 | 谷歌开源高效的移动端视觉识别模型：MobileNet

选自Google Research 机器之心编译参与：蒋思源近日，谷歌开源了 MobileNet，它一个支持多种视觉识别任务的轻量级模型，还能高效地在移动设备上运行。同时机器之心也关注过开源圈内利用苹果最新发布的 Core ML 实现的谷歌移动端神经网络 MobileNet。此外，谷歌的这次开源充分地体现了其「移动优先」与「AI 优先」的有机结合。项目地址：https://github.com/tensorflow/models/blob/master/slim/nets/mobilenet_v1

06

计算机视觉研究院：AI部署以及工业落地学习之路（文章较长，建议收藏）

计算机视觉研究院专栏作者：Edison_G 最近在复盘今年上半年做的一些事情，不管是训练模型、部署模型搭建服务，还是写一些组件代码，零零散散是有一些产出。本文主要转自知乎《链接：https://zhuanlan.zhihu.com/p/386488468》公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式深感还有很多很多需要学习的地方。既然要学习，那么学习路线就显得比较重要了。本文重点谈谈学习AI部署的一些基础和需要提升的地方。这也是老潘之前学习、或者未来需要

03

ResNet图像识别准确率暴降40个点！这个ObjectNet让世界最强视觉模型秒变水货

计算机视觉模型已经学会了非常精确地识别照片中的物体，甚至有些模型在某些数据集上的表现比人类更好。但是，同样的物体检测器如果在现实世界中使用，它们的性能会显著下降，这就给自动驾驶汽车和其他使用机器视觉的安全至关重要的系统带来了可靠性方面的担忧。

01

人工智能 - 目标检测算法详解及实战

目标检测（Object Detection）是计算机视觉和人工智能领域中的一个重要任务，旨在识别图像或视频中的特定目标，并确定其在图像中的位置。目标检测广泛应用于自动驾驶、安防监控、人脸识别等领域。

00

视频目标跟踪从0到1，概念与方法

从目标跟踪的应用场景，底层模型，组件，类型和具体算法几个方面对目标跟踪做了全方面的介绍，非常好的入门文章。

01

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

选自medium 机器之心编译机器之心编辑部 Faster R-CNN、R-FCN 和 SSD 是三种目前最优且应用最广泛的目标检测模型，其他流行的模型通常与这三者类似。本文介绍了深度学习目标检测的

07

目标检测综述：基于至今先进深度学习的目标检测模型综述（附综述论文及代码下载）

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2104.11892.pdf 计算机视觉研究院专栏作者：Edison_G 目标检测是对图像或视频中的目标进行分类和定位的任务。由于其广泛的应用，近年来它已获得突出地位。 01 概述今天分享中我们调查了基于深度学习的目标检测器的最新发展。还提供了检测中使用的基准数据集和评估指标的简明概述，以及检测任务中使用的一些突出的

01

精度45.9%，推理速度72.9FPS，百度飞桨推出工业级目标检测模型 PP-YOLO

工业视觉、自动驾驶、安防、新零售等我们身边熟知的各行各业都需要目标检测技术，由于其很好的平衡了标注成本、检测精度和速度等，成为当前智能制造产业升级浪潮中被商业化应用最为广泛的AI技术之一。

02

【建议收藏】CV学习路径推荐

掌握Python基础理论知识、了解第三方数据科学库，能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。

02

音视频技术开发周刊 | 239

每周一期，纵览音视频技术领域的干货。新闻投稿：contribute@livevideostack.com。什么是体积视频？本文介绍了体积视频（Volumetric Video）的解释，创建体积视频所需的设备，并给出了具体的用例。原创干货 | 入门或者转行音视频，应该要怎么做？想从事（入门或者转行）音视频开发，要怎么做？很多人对此都有疑惑，不光有工作多年的职场老司机，也有求学期间的研究生同学们，本文帮你分析到底要不要从事音视频开发工作，以及如果从事音视频开发要怎么做？虎牙直播在AI实时剪辑技术上

03

李沐等将目标检测绝对精度提升 5%，不牺牲推理速度

目标检测无疑是计算机视觉领域最前沿的应用之一，吸引了各个领域诸多研究者的目光。最前沿的检测器，包括类似 RCNN 的单（SSD 或 YOLO）或多阶神经网络都是基于图像分类骨干网络，如、、Inception 或 MobileNet 系列。

01

李沐等将目标检测绝对精度提升 5%，不牺牲推理速度

目标检测无疑是计算机视觉领域最前沿的应用之一，吸引了各个领域诸多研究者的目光。最前沿的检测器，包括类似 RCNN 的单（SSD 或 YOLO）或多阶神经网络都是基于图像分类骨干网络，如 VGG、ResNet、Inception 或 MobileNet 系列。

02

TTFNet | 最大程度提高训练效率的实时目标检测（附源码）

现在目标检测器很少能同时实现训练时间短，推理速度快，精度高。为了达到平衡，作者就提出了Train-Friendly Network(TTFNet)。作者从light-head, single-stage, and anchor-free设计开始，这使得推理速度更快。然后作者重点缩短训练时间。

01

PyTorch官方教程大更新：增加标签索引，更加新手友好

如果你是PyTorch 24K纯萌新，PyTorch官方一如既往地向你推荐他们最受欢迎的教程之一：60分钟入门PyTorch（Start 60-min blitz）。

04

【建议收藏】CV学习路径推荐

我跟几位BATJ现职的CV算法工程师聊了聊学习路径的话题—— 学习CV要具备哪些基础？ CV算法工程师应当掌握哪些技能？ 01 学习CV要具备哪些基础 01 编程与数理基础掌握Python基础理论知识、了解第三方数据科学库，能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。 02 机器学习基础了解线性回归、逻辑回归、决策树等机器学习经典模型、能够基于Python语言上手机器学习算法实践。 03 深度学习基础熟练卷积神经网络和循环神经网络、了解简单的Pytor

03

扔掉目标检测器，实现真正的端到端多模态预训练！阿里提出E2E-VLP（ACL2021）

基于大规模图文对的视觉-语言预训练(VLP)已经让许多跨模态的下游任务取得了巨大的性能提升。现有的大多数预训练方法主要采用两步训练过程，即首先使用预训练的目标检测器提取基于区域的视觉特征，然后将图像表示和文本嵌入串联起来作为Transformer的输入进行训练。

02

海康研究院出品：具有场景自适应概念学习的无监督目标检测（附论文下载）

关注并星标从此不迷路计算机视觉研究院 📷 📷 📷 公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式 📷 论文地址：http://www.jzus.zju.edu.cn

01

用于增强现实的实时可穿带目标检测：基于YOLOv8进行ONNX转换和部署

今天给大家介绍了一种在增强现实（AR）环境中使用机器学习（ML）进行实时目标检测的软件体系结构。

03

构建对象检测模型

我喜欢深度学习。坦率地说，这是一个有大量技术和框架可供倾注和学习的广阔领域。当我看到现实世界中的应用程序，如面部识别和板球跟踪等时，建立深度学习和计算机视觉模型的真正兴奋就来了。

01

YoloV8与ChatGPT互通，这功能是真的强大！

参考地址：https://github.com/ultralytics/ultralytics

04

MoCo不适用于目标检测？MSRA提出对象级对比学习的目标检测预训练方法SoCo！性能SOTA！（NeurIPS 2021）

本文分享 NeurIPS 2021 论文『Aligning Pretraining for Detection via Object-Level Contrastive Learning』MSRA提出对象级对比学习的目标检测预训练方法！性能SOTA！

04

如果你心里还只有YOLO-World你就输了！DetCLIPv3出手，性能大幅度超出一众SOTA模型！

在预训练之后是一个微调阶段，利用少量高分辨率样本进一步提高检测性能。借助这些有效的设计，DetCLIPv3展示了卓越的开词汇检测性能，例如，作者的Swin-T Backbone 模型在LVIS minival基准上取得了显著的47.0零样本固定AP，分别优于GLIPv2、GroundingDINO和DetCLIPv2 18.0/19.6/6.6 AP。DetCLIPv3在VG数据集上的密集字幕任务也取得了先进的19.7 AP，展示了其强大的生成能力。

01

深度 | 最后一届ImageNet挑战赛落幕，「末代」皇冠多被国人包揽

选自LSVRC 2017 机器之心编译参与：机器之心编辑部近日，ImageNet 最后一届挑战赛成绩已经公布，多个国内院校和企业在各个比赛项目上取得了非常不错的成绩。奇虎和南京信息工程大学团队分别在定位任务和检测任务上取得了最佳成绩。本文将首先介绍本次的比赛情况，并简要介绍优秀团队的建模方法。同时我们也关注了 WebVision 挑战赛近日公布的结果。在本次 ImageNet 竞赛中，南京信息工程大学和帝国理工学院的团队 BDAT 获得了目标检测的最优成绩，最优检测目标数量为 85、平均精确率为 0.

05

Q-YOLO：用于实时目标检测的高效推理

与近年来大规模视觉transformers（ViTs）的巨大进步相比，基于卷积神经网络（CNNs）的大规模模型仍处于早期状态。

03

FedPylot，联邦学习框架下的YOLOv7实时目标检测与隐私保护研究！

智能交通系统（ITS）有望通过提高安全性、优化交通流量、减少车辆排放和燃油消耗以及提供信息娱乐服务来 Reshape 流动性。这种转变得益于机器学习（ML）和车辆与一切（V2X）通信技术的进步，促进了车辆网络、行人和基础设施之间的无缝合作，产生了大量数据，并整合成一个统一的车辆互联网（IoV）[1]。为了实现数据共享，IoV依赖于最先进的无线网络技术，这些技术可以提供远距离、低延迟、可靠和安全的传输[2]。

01

YoloX大升级：阿里巴巴提出新框架，超越Yolov6和PPYoloE（附源代码）

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式代码地址： https://github. com/alibaba/EasyCV 计算机视觉研究院专栏作者：Edison_G 最新阿里巴巴研究员，基于自研平台，对YoloX检测框架进行了改进，并且效率更快，超越了Yolov6和PP-YoloE等网络。 01 概述 EasyCV是阿里巴巴开源的基于Pytorch，以自监督学习和Transformer技术为核心的 all-in-o

02

什么是MAP？理解目标检测模型中的性能评估

【导读】近日，机器学习工程师Tarang Shah发布一篇文章，探讨了机器学习中模型的度量指标的相关问题。本文首先介绍了机器学习中两个比较直观和常用的度量指标：精确度和召回率，然后详细讲解了目标检测领

05

Thermal Object Detection using Domain Adaptation through

最近发生的一起自动驾驶车辆致命事故引发了一场关于在自动驾驶传感器套件中使用红外技术以提高鲁棒目标检测可见性的辩论。与激光雷达、雷达和照相机相比，热成像具有探测红外光谱中物体发出的热差的优点。相比之下，激光雷达和相机捕捉在可见光谱，和不利的天气条件可以影响其准确性。热成像可以满足传统成像传感器对图像中目标检测的局限性。提出了一种用于热图像目标检测的区域自适应方法。我们探讨了领域适应的多种概念。首先，利用生成式对抗网络，通过风格一致性将低层特征从可见光谱域转移到红外光谱域。其次，通过转换训练好的可见光光谱模型，采用具有风格一致性的跨域模型进行红外光谱中的目标检测。提出的策略在公开可利用的热图像数据集(FLIR ADAS和KAIST多光谱)上进行评估。我们发现，通过域适应将源域的低层特征适应到目标域，平均平均精度提高了约10%。

01

【建议收藏】CV算法工程师自修指南

我跟几位BATJ现职的CV算法工程师聊了聊学习路径的话题—— 学习CV要具备哪些基础？ CV算法工程师应当掌握哪些技能？ 01 学习CV要具备哪些基础 01 编程与数理基础掌握Python基础理论知识、了解第三方数据科学库，能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。 02 机器学习基础了解线性回归、逻辑回归、决策树等机器学习经典模型、能够基于Python语言上手机器学习算法实践。 03 深度学习基础熟练卷积神经网络和循环神经网络、了解简单的Pytor

03

CVPR：IoU优化——在Anchor-Free中提升目标检测精度（附源码）

计算机视觉研究院专栏作者：Edison_G 目前的anchor-free目标检测器非常简单和有效，但缺乏精确的标签分配方法，这限制了它们与经典的基于Anchor的模型竞争的潜力公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式 1 简要目前的anchor-free目标检测器非常简单和有效，但缺乏精确的标签分配方法，这限制了它们与经典的基于Anchor的模型竞争的潜力，这些模型由基于IoU度量的精心设计的分配方法支持。今天分享中，研究者提出了伪IoU：一个简单的度量

02

【CNN调参】目标检测算法优化技巧

目标检测模型相比于分类模型的研究相比，更缺少普遍性，并且网络结构和优化目标更加复杂。

03

Domain Adaptive Faster R-CNN for Object Detection in the Wild

典型的目标检测假定训练和测试数据来自同一个理想分布，但是在实际中这通常是不满足的。这种分布的错误匹配将会导致一个明显的性能下降。这篇工作我们旨在提升目标检测的跨域鲁棒性。我们在两个层级上解决域偏移问题：(1)、图像级偏移，例如图像的风格、亮度等。(2)、实例级偏移，例如目标的外观、尺寸等。基于最近的最先进的目标检测器Faster R-CNN来构建我们的方法，我们设计了两个域适配组件，图像级和实例级，来减少域矛盾。这两个域适配组件基于H散度理论，并且用对抗训练方式训练的域分类器来实现。不同级别的域分类器用连续正则化进一步加强，目的是在Faster R-CNN模型上学习一个域不变RPN。使用多个数据集包括Cityscapes，KITTI，SIM10K等来评估我们新提出的方法。结果证明对各种域迁移场景的鲁邦目标检测，我们提出的方法很有效。

02

自动化数据引擎 AIDE | 自动识别问题、自动标注改进模型，不在依赖大量人工数据标注！

自动驾驶车辆（AVs）在一个不断变化的世界中运行，遭遇着在长尾分布中的各种物体和情景。这种开放世界的特性对AV系统提出了重大挑战，因为这是一个对安全至关重要的应用，必须部署可靠且训练有素的模型。随着环境的发展，对持续模型改进的需求变得明显，要求具备应对突发事件的可适应性。

01

NeurIPS'22｜Hinton团队开源：用一个统一的接口处理四大视觉任务

来源：极市平台本文约1800字，建议阅读5分钟本文提出了一种将四个看似不同的视觉任务（目标检测，实例分割，关键点检测，图像描述）统一在单个像素到序列界面中的方法。论文链接：https://arxiv.org/pdf/2206.07669v2.pdf 源码链接：https://github.com/google-research/pix2seq 简介训练能够执行无数个任务的单个神经网络模型是迈向通用人工智能的重要一步。在NLP领域，许多NLP相关任务都可以统一在大型语言模型下进行。主要原因是这些任务

01

xYOLO | 最新最快的实时目标检测

随着物联网(IoT)、边缘计算和自主机器人等领域的车载视觉处理技术的出现，人们对复合高效卷积神经网络模型在资源受限的硬件设备上进行实时目标检测的需求越来越大。Tiny-YOLO通常被认为是低端设备中速度更快的对象探测器之一，这个也是今天作者工作的基础。

01

YOLO v4：物体检测的最佳速度和精度

您只需看一次（YOLO）是快速、准确的单阶段目标检测器。最近发布的YOLO v4与其他目标检测器相比，显示出非常好的结果。

03

YOLOv8 深度解析！一文看懂，快速上手实操（附实践代码）

开源地址：https://github.com/ultralytics/ultralytics

02

CVPR 2024 | GLEE 华科与字节跳动联手打造全能目标感知基础模型

近年来，LLM在文本处理的领先地位和视觉模型如CLIP在多模态任务上优秀的泛化表现，展示了基础模型在推进多模态感知、理解、生成方面的强大潜力。

01

用Jetson NANO规划一个统计访客数量的系统

我们的想法是对视频流进行实时分析，如果满足一定的条件，就对客户进行计数。我们在几天内做了一个柜台，并使用人工智能算法计算路过的游客和那些停下来的人。在下面的文章中，我将解释我们是如何做到这一点的，以及它的用途。

02

春假返程堵车 | AI“高速”检测轻而易举监测大家安全

欢迎关注“计算机视觉研究院” 计算机视觉研究院专栏作者：Edison_G 春节返程大军开始了！不管是离开小城镇还是进入大城市，每个高速路口都是堵车，现在人工智能愈来愈发达，不再用通过交警得知高速公路上的案发事件，现在都是摄像机覆盖，AI可以通过镜头&算法检测到行驶的车辆，如果有交通事故都是第一时间传达交警来处理。以至于有些路段都是通过无人机来进行交通事故处理！长按扫描二维码关注我们一、简要 Single-stage目标检测方法因其具有实时性强、检测精度高等特点，近年来受到广泛关注。通常，大多

02

CVPR 2024 | 一统所有目标感知任务，华科&字节提出目标感知基础模型GLEE

近年来，LLM 已经一统所有文本任务，展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力，其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务，目前依然缺乏一个强大的基础模型。

01

IJCAI Oral：弱监督实现精确目标检测，上交大提出协同学习框架

---- 新智元专栏作者：上海交通大学未来媒体网络协同创新中心【新智元导读】训练一个高准确率的检测模型需要大量精细标注的图片数据，其成本很高。本文提出了一种弱监督协同学习框架，仅使用粗略标签的图片训练目标检测模型，测试结果显示其定位精确率和检测准确率均显著优于目前最先进的方法。目标检测是机器视觉的基本问题，在视频监控、无人驾驶等场景都有广泛应用。随着深度学习的兴起，近年来涌现了大量优秀的目标检测模型。然而，训练一个高准确率的检测模型需要大量的以包围框形式精细标注的图片数据作为模型监督条件，需要

01

Python Web 深度学习实用指南：第三部分

本节将说明 API 在软件开发中的一般用法，并说明如何使用不同的最新深度学习 API 来构建智能 Web 应用。我们将涵盖自然语言处理（NLP）和计算机视觉等领域。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭