腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”。www.52cv.net QQ群: 805388940
专栏成员
举报
842
文章
927653
阅读量
62
订阅数
订阅专栏
申请加入专栏
全部文章(842)
https(243)
网络安全(223)
编程算法(213)
深度学习(175)
神经网络(170)
机器学习(132)
开源(129)
人工智能(118)
github(112)
图像处理(110)
模型(105)
数据(84)
git(83)
图像识别(81)
论文(42)
视频(38)
性能(36)
人脸识别(34)
NLP 服务(30)
监督学习(30)
tcp/ip(27)
框架(26)
pytorch(23)
安全(23)
设计(20)
网络(20)
linux(19)
卷积神经网络(19)
算法(19)
工作(18)
测试(17)
opencv(16)
tensorflow(14)
python(14)
腾讯云测试服务(14)
学习方法(14)
token(14)
文件存储(12)
渲染(11)
自动驾驶(10)
css(10)
文字识别(10)
缓存(10)
mask(10)
对象(10)
基础(10)
可视化(10)
优化(10)
数据结构(9)
架构(9)
数据库(8)
http(8)
存储(8)
强化学习(8)
数据分析(8)
迁移(8)
image(8)
编码(8)
系统(8)
sql(7)
批量计算(7)
日志服务(7)
无人驾驶(7)
patch(7)
函数(7)
html(6)
ide(6)
迁移学习(6)
腾讯云开发者社区(6)
联邦学习(6)
map(6)
go(5)
api(5)
网站(5)
大数据(5)
机器人(5)
db(5)
video(5)
工具(5)
公众号(5)
计算机视觉(5)
连接(5)
腾讯(5)
javascript(4)
云直播(4)
vr 视频解决方案(4)
游戏(4)
面向对象编程(4)
kernel(4)
数据处理(4)
block(4)
gpt(4)
gpu(4)
network(4)
教程(4)
开发(4)
量化(4)
.net(3)
android(3)
单片机(3)
打包(3)
人脸核身(3)
正则表达式(3)
视频分析(3)
图像分析(3)
backbone(3)
embedding(3)
epoch(3)
mobile(3)
spatial(3)
变量(3)
部署(3)
集群(3)
手机(3)
效率(3)
异常(3)
scala(2)
node.js(2)
jquery(2)
arm(2)
短视频(2)
SSL 证书(2)
医疗(2)
容器(2)
分布式(2)
自动化(2)
keras(2)
无监督学习(2)
微信(2)
智能推荐平台(2)
action(2)
agent(2)
detection(2)
frame(2)
identity(2)
key(2)
masking(2)
modeling(2)
path(2)
self(2)
set(2)
shift(2)
size(2)
super(2)
text(2)
time(2)
表格(2)
布局(2)
产品(2)
内存(2)
搜索(2)
统计(2)
图表(2)
隐私(2)
图像分割(2)
对象存储(1)
其他(1)
cocoa(1)
xcode(1)
java(1)
c 语言(1)
c++(1)
bootstrap(1)
xml(1)
typescript(1)
opengl(1)
汇编语言(1)
硬件开发(1)
flask(1)
mapreduce(1)
访问管理(1)
人脸融合(1)
知识图谱(1)
云转码(1)
数据安全(1)
svg(1)
shell(1)
ssh(1)
gcc(1)
scikit-learn(1)
模式识别(1)
小程序(1)
windows(1)
架构设计(1)
sas(1)
fpga(1)
分类算法(1)
5g(1)
unicode(1)
sdk(1)
ghost(1)
手势识别(1)
视频理解(1)
汽车(1)
智能制造(1)
大模型视频创作引擎(1)
acm(1)
adobe(1)
aigc(1)
alpha(1)
analysis(1)
ast(1)
blur(1)
cell(1)
class(1)
code(1)
dataset(1)
dp(1)
encoding(1)
evaluation(1)
feed(1)
filter(1)
gradient(1)
header(1)
highlight(1)
input(1)
instance(1)
intel(1)
iot(1)
jpeg(1)
kaggle(1)
ld(1)
line(1)
live(1)
local(1)
localization(1)
ls(1)
lstm(1)
max(1)
mean(1)
medium(1)
mef(1)
memory(1)
mesh(1)
mnist(1)
model(1)
mq(1)
normalization(1)
owl(1)
padding(1)
parallax(1)
performance(1)
point(1)
precision(1)
prediction(1)
proc(1)
process(1)
prompt(1)
ps(1)
random(1)
reshape(1)
rgb(1)
sampling(1)
scale(1)
shuffle(1)
sign(1)
split(1)
stream(1)
table(1)
vr(1)
yolo(1)
youtube(1)
zero(1)
百度(1)
插件(1)
程序(1)
反射(1)
服务(1)
工程师(1)
集合(1)
技巧(1)
计算机(1)
解决方案(1)
开发环境(1)
科技(1)
流量(1)
苹果(1)
实践(1)
数组(1)
索引(1)
压缩(1)
音频(1)
用户体验(1)
原理(1)
搜索文章
搜索
搜索
关闭
教程系列2 | 趋动云『社区项目』一步实现与 AI 对话
部署
教程
开发环境
模型
数组
Llama3-8B-Chinese-Chat 是一个针对中文和英文用户的指令调整语言模型,具有各种能力,如角色扮演和工具使用,建立在 Meta-Llama-3-8B-Instruct 模型之上。但相较于 Llama3-8B-Instruct,Llama3-8B-Chinese-Chat 模型不会出现中文问题英文回答、中英夹杂的回答的问题,以及说话更为正式(Llama3-8B-Instruct真的很喜欢输出emoji)。
CV君
2024-07-24
111
0
西工大&西澳大学&同济大学 第一篇图卷积网络在图像复原上综述(论文开源)
论文
数据
网络
开源
卷积神经网络
本篇分享论文Graph Convolutional Network for Image Restoration: A Survey,由西工大&西澳大学&同济大学共同发布,第一篇图卷积网络在图像复原上综述(论文开源)。
CV君
2024-07-24
111
0
手把手教程 | GPU云上极速部署 SD WebUI
gpu
部署
教程
模型
数据
Stable-diffusion-webui 是一个支持 Stable Diffusion 的交互界面应用,支持以下多种功能:文生图、图生图、图像修复/扩展、彩色素描等等。
CV君
2024-07-12
265
0
厦门大学首发多模态阅读理解新任务: 图文深度融合数据集VEGA
测试
产品
论文
模型
数据
多模态大型语言模型(MLLMs)的高速发展彰显了其在处理图文信息方面的强大潜力。然而,目前的多模态模型和方法主要集中于处理基础视觉问答(VQA)任务,这些任务通常只涉及与问题强相关的有限图片和文本信息。在实际应用中,尤其是文档理解领域,模型经常需要处理更为复杂的图文混合输入,这些输入不仅长度更长,而且可能包含冗余甚至误导性的信息。现有的主流MLLMs在处理此类复杂任务时表现不佳,且缺乏相应的Benchmark来评估模型在这些任务上的性能。
CV君
2024-07-12
320
0
xLSTM成功杀入医学图像分割领域,取代Mamba成为新SOTA!魔芯科技联合多单位推出
模型
数据
图像分割
架构
科技
近年来,Mamba作为一种处理长距离依赖关系的计算模块,在医学图像分割领域取得了显著进展。而近期,来自浙江大学,魔芯科技,中科大等单位的研究人员将Mamba替换为xLSTM,提出 xLSTM-UNet(xLSTM-UNet can be an Effective 2D \& 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart),通过引入扩展长短期记忆网络(xLSTM),在多个医学图像分割任务中表现出色,超越了基于Mamba的模型!
CV君
2024-07-12
233
0
身手不凡的机器人,开源项目汇总
数据
开源
机器人
论文
模型
最初,因隋炀帝思念心切,命工匠按照柳抃的形象制作了木偶机器人,被认为是历史上最早的机器人之一。这些木偶机器人通过精巧设计的机关,能够执行坐、起、拜、伏等动作。
CV君
2024-07-12
248
0
虚拟试衣技术发展综述:从应用到开源资源
数据
游戏
开源
论文
模型
虚拟试衣是通过虚拟的技术手段,实现用户不用脱去身上衣服,完成变装的效果。最初,起源于换装游戏,随着互联网的普及和电子商务的兴起,消费者对在线购物体验的需求不断增加,虚拟试衣技术因此得到了快速发展。现如今,虚拟试衣技术多应用于:
CV君
2024-07-12
336
0
姿态估计开源模型、数据集分享
开源
论文
模型
数据
系统
姿态估计是一种计算机视觉技术,旨在从图像或视频中识别和理解人体的姿势或动作。它涉及检测人体的关键点,如头部、肩膀、手臂、腿部等,并确定它们之间的关系,以推断出人体的姿势或动作。
CV君
2024-06-28
321
0
超分辨率开源库 GitHub 热门项目分享
模型
视频
数据
github
开源
随着图像和视频数据量的急剧增加,以及人们对高质量图像需求的不断提升,超分辨率技术也在不断发展,以满足实际应用的需求。本文将分享一些相关的开源库和数据集,希望能够帮助该领域的研究人员推进研究和应用。
CV君
2024-06-27
469
0
首个4D视频生成扩散模型!Diffusion4D数分钟内实现4D内容生成,超81K的4D数据集已开源!
开源
模型
视频
数据
渲染
本文介绍由多伦多大学,北京交通大学,德克萨斯大学奥斯汀分校和剑桥大学团队最新提出的4D生成扩散模型,该方法可以在几分钟之内可以完成时空一致的4D内容生成。
CV君
2024-06-27
211
0
多模态大模型的多语种文字理解能力还有很长的路要走,字节、华科联合发布MTVQA Bench
开源
测试
模型
数据
人工智能
近期多模态大模型(MLLM)在视觉文本理解领域取得了显著进展,比如开源模型InternVL 1.5、MiniCPM-Llama3-V 2.5、TextMonkey, 闭源模型GPT-4o、Claude等,甚至在某些方面展现了超越人类的能力。然而,当前的评估主要集中在英文和中文的语言环境中,对于更具挑战的多语种环境,研究还相对缺乏。
CV君
2024-06-27
262
0
CVPR竞赛冠军方案:复杂场景下的视频对象分割
视频
数据
性能
对象
框架
由鹏城实验室、哈工大深圳和University of California at Merced组成的团队在CVPR2024 PVUW比赛的MOSE视频对象分割赛道获得冠军。
CV君
2024-06-27
200
0
多模态大模型面对误导性问题:看懂图片也会答错,一骗就中招
模型
数据
性能
开源
测试
多模态大语言模型(MLLMs)因其在视觉理解和推理方面的突出表现,例如生成详细的图像描述和回答复杂的问题等,逐渐成为近期AI研究的热点。
CV君
2024-06-27
151
0
CVPR竞赛冠军方案:运动表达引导视频分割方法,代码及技术报告均已开源
视频
开源
视频分析
对象
模型
在CVPR 2024 像素级视频理解(PVUW)挑战赛中,来自塔普智能(Tapall.ai)、南方科技大学、谢菲尔德大学、华威大学的研究团队在运动表达引导视频分割(MeViS)赛道上获得冠军。该团队提出的技术专为解析由自然语言表达引导的视频内容而设计,致力于提高视频分割的准确性和效率。
CV君
2024-06-27
150
0
智源和港中文联合提出首个多功能3D医学多模态大模型(文本、定位和分割任务)
开源
图像分析
工作
模型
数据
智源和香港中文大学联合提出的 M3D 系列工作,包括 M3D-Data, M3D-LaMed, 和 M3D-Bench, 从数据集、模型和测评全方面推动 3D 医学图像分析的发展。
CV君
2024-06-27
196
0
CVPR 2024 | 如何给 NeRF 开透视眼?
算法
开源
框架
设计
数据
本文为粉丝投稿,原文链接:https://zhuanlan.zhihu.com/p/702702109。
CV君
2024-06-17
271
0
Gemini在大考终于赢了GPT-4o!Jeff Dean连续转发三次!Video-MME首个视频多模态基准来了!
gpt
video
模型
视频
数据
近日,中科大、厦大、港中文等高校联合推出多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。Gemini 1.5 Pro在这份榜单中遥遥领先,证明其在视频理解领域的霸主地位。Video-MME一经推出,更是被谷歌首席科学家Jeff Dean连续转发了三次!目前已有近30万的浏览量,热度很高。
CV君
2024-06-17
280
0
ETH Zurich、A*STAR等联合工作:重新审视并改正小样本3D分割任务中的问题,新benchmark开启广阔提升可能性!
工作
模型
性能
优化
测试
本文分享 CVPR 2024 论文Rethinking Few-shot 3D Point Cloud Semantic Segmentation,重新审视并改正小样本3D分割任务中的问题,作者来自 ETH Zurich 等联合团队。
CV君
2024-06-17
102
0
TPAMI 2024|DeepM2CDL:基于层级式多尺度卷积字典的多模态图像修复与融合网络
工作
模型
数据
算法
网络
本文为粉丝投稿,原文链接:https://zhuanlan.zhihu.com/p/701844704。
CV君
2024-06-17
352
0
全新Mobile-Agent-v2发布,自动化手机操作助手全面升级!
mobile
视频
手机
自动化
agent
Mobile-Agent 于今年年初发布,凭借强劲的自动化手机操作能力迅速在AI领域和手机制造商中引起广泛关注。短短五个月内,它已经在Github获得了2,000个Star。该系统采用纯视觉方案,通过视觉感知工具和操作工具完成智能体在手机上的操作,无需依赖任何系统级别的UI文件。得益于这种智能体中枢模型的强大,Mobile-Agent实现了即插即用,无需进行额外的训练和探索。
CV君
2024-06-17
428
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档