首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

一个模型搞定所有场景!哈工大&罗切斯特大学提出无监督多场景ReID新方案

CoovallyAIHub

行人重识别(ReID)技术在现代安防、智慧城市等领域扮演着关键角色。想象一下,在茫茫人海中快速锁定特定目标——这正是ReID的核心任务。

1000

告别“模糊”与“迟钝”!首创波动方程建模视觉,ImageNet 84.2%,推理速度飙升

CoovallyAIHub

在深度学习视觉建模领域,如何既实现高效的全局语义交互,又能精准保留图像中的高频细节(如边缘和纹理),一直是一个关键难题。传统的卷积神经网络(CNN)依赖局部感受...

2300

大道至简:腾讯优图只用纯视觉模型,4张图超越全量训练SOTA

CoovallyAIHub

近年来,计算机视觉领域掀起了一股“视觉-语言大模型”的浪潮。从CLIP到各种多模态模型,研究者们似乎默认:解决复杂视觉任务必须依赖语言模型的加持。

3000

机器人通过自学习实现逼真唇部同步

用户11764306

当人们面对面交谈时,近一半的注意力会集中在嘴唇的运动上。尽管如此,机器人仍然很难以一种令人信服的方式移动嘴巴。即使是最先进的人形机器,也常常依赖僵硬、夸张的嘴巴...

3810

计算机视觉_CNN与目标检测实战

心疼你的一切

计算机视觉(Computer Vision, CV)是人工智能领域的一个重要分支,致力于让计算机能够理解和解释视觉信息。从图像分类到目标检测,从图像分割到场景理...

4510

使用 OpenCV 进行图像识别:人脸与物体检测

1xsss

在人工智能与数字技术飞速发展的今天,计算机视觉已成为连接物理世界与数字世界的核心桥梁,广泛应用于安防监控、自动驾驶、智能家居、医疗影像分析等领域。OpenCV(...

27020

从“单例模仿”到“多面融合”,视觉上下文学习迈向“团队协作”式提示融合

CoovallyAIHub

在人工智能领域,让模型具备 “看几个例子就能学会新任务” 的能力,一直是研究者追求的目标。这种在自然语言处理中已趋成熟的上下文学习(In-Context Lea...

10310

还在用“网格”预测深度?浙大新方法让你直接“函数调用”,打破分辨率枷锁!

CoovallyAIHub

深度估计是计算机视觉的基石,广泛应用于自动驾驶、机器人、AR/VR等领域。传统深度估计方法一直受限于一个根本性约束:它们只能在预设的离散像素网格上输出深度。

9710

计算机视觉的 2026:从“堆算力”竞赛,到“省算力”智慧

CoovallyAIHub

2026 年,计算机视觉早已不是实验室里的小众技术 —— 它是自动驾驶汽车的 “眼睛”,是医疗影像诊断的 “辅助手”,是机器人交互的 “感知中枢”,更是多模态大...

7510

视频超分辨率如何提升跨视角行人识别?让监控画面“看清”每一个人

CoovallyAIHub

在城市的天空与地面之间,无数摄像头正默默记录着行人的轨迹。但你是否想过,当一个模糊的身影从无人机画面中掠过,我们如何在地面监控中准确找到同一个人?这正是跨视角行...

12310

计算机视觉与机器学习在语音交互中的应用

用户11764306

2021年10月28日,某中心 Alexa AI 团队的首席应用科学家 Pradeep Natarajan 加入了首席 Alexa 技术推广专家 Jeff Bl...

9410

图像标注核心实践指南:提升模型准确率的关键步骤

用户11764306

图像标注或图像注释是计算机视觉的基石。这是一个为图像数据分配有意义的标签或注释的过程,以使计算机视觉模型能够学习模式并做出预测。无论是目标检测、图像分类还是图像...

5010

英伟达CES 2026炸场:没有新显卡,却掏出了让全球AI公司彻夜难眠的“算力核弹”

CoovallyAIHub

英伟达在CES 2026上抛出一系列重磅炸弹,直接宣告了AI算力工厂时代的到来。没有游戏显卡的更新,却有一场彻底改变AI产业格局的技术革命。

17810

如何用10%的标注数据,达到可媲美全监督模型的性能?AAAI 2026论文揭秘BCSI三大创新设计

CoovallyAIHub

随着人工智能在医学影像分析领域的深入应用,精确的图像分割已成为计算机辅助诊断、手术规划和疗效评估的关键技术。然而,高质量医学图像的标注不仅成本高昂,还需要顶级专...

7410

软件著作权登记证书识别:CV+NLP驱动的文档理解新范式

中科逸视OCR专家

随着我国软件产业的蓬勃发展,软件著作权登记数量持续攀升。据中国版权保护中心统计,2025年全国软件著作权登记总量已突破300万件。面对海量纸质或扫描版的软件著作...

9210

基于视觉大模型的实时监控系统技术实现解析

思通数科

若你正关注计算机视觉技术在货架状态感知场景的落地,寻求低成本、高复用性的实时监控技术方案,那么这款AI视觉系统的技术实现逻辑值得深入探讨。其核心围绕视觉感知与智...

5610

YOLO26正式亮相!极致速度优化,为落地而生!

CoovallyAIHub

就在刚刚,Ultralytics 正式发布 YOLO26,这是迄今为止最先进、最易部署的 YOLO 模型。就是那个在 YOLO Vision 2025 大会上首...

1.5K170

仅192万参数的目标检测模型,Micro-YOLO如何做到目标检测精度与效率兼得

CoovallyAIHub

随着目标检测技术在自动驾驶、安防监控、智能终端等领域的广泛应用,如何在计算资源有限的嵌入式设备中高效部署检测模型,已成为工业界与学术界共同关注的核心问题。传统的...

12310

2026 CES 如何用“视觉”改变生活?机器的“视觉大脑”被点亮

CoovallyAIHub

机器人能叠衣倒水,AI伴侣看懂你的眼神——这一切都因为,机器终于学会了真正地“看”世界。

11110
领券