CVer 有几天没更新论文速递了,主要是这段时间的论文太多,而且质量较高的论文也不少,所以为了方便大家阅读,我已经将其中的目标检测(Object Detection)论文整理出来。本文分享的目标检测论文将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问):
三维人体建模作为计算机人体仿真的一个组成部分,一直是人们研究的热点之一。自交互式计算机图形学诞生之日起,就有学者不断探索计算机人体建模技术。从线框建模、实体建模、曲面建模发展到基于物理的建模,已取得重大进展。3维度人体建模在医学图像、生物医学、手势识别、视频会议、视频游戏、自动新闻播放、电影制作、材料变形、图象压缩等方面都有实际应用价值。
Apple is working on at least two AR projects that include an augmented reality headset set to be released in late 2022 or 2023 followed by a sleeker pair of augmented reality glasses coming at a later date.
每个 Flag 包括 flag_name, default value 和 description.
机器人与其他智能设备需要根据自身搭载的视觉系统实现高效的目标级场景表达以进行接触、物理、遮挡等推理。已知的精确目标模型在未知结构的非参数化重建中起着十分重要的作用。我们提出了一种系统,该系统能够估计实时多视角场景中接触、遮挡已知目标的精确位姿。我们的方法能从单一的RGBD视角估计3D目标位姿,随着相机的移动,能够从多个视角累积位姿估计和非参数化的occupancy信息,并执行联合优化来对接触的多个接触目标进行一致非交叉的位姿估计。
Takes in all sensory data and computes actions for the robot. Service robots have low requirements for the computing hardware (RPi 3/4 can be fine) but autonomous vehicles require powerful and customized computing units.
Segmentation.X - Papers and Benchmarks about semantic segmentation, instance segmentation, panoptic segmentation and video segmentation
腾讯多媒体实验室积极投入前沿技术研究,取得显著成果。2021年,腾讯多媒体实验室在国际知名期刊(IEEE Trans. on CSVT, Proceedings of the IEEE等)及领域旗舰会议(ICIP, ICME, PCS, VCIP等)上发表论文数十篇,主要包括视频编解码、沉浸式媒体、多媒体AI等研究方向。本文将对部分论文进行解读。 A Real-Time H.266/VVC Software Decoder 一个实时 H.266/VVC 软件解码器 https://ieeexplore.ie
【导读】专知内容组整理了最近八篇目标跟踪(Object Tracking)相关文章,为大家进行介绍,欢迎查看! 1. Adaptive Correlation Filters with Long-Term and Short-Term Memory for Object Tracking(基于具有长期和短期自适应记忆相关滤波的目标跟踪) 作者:Chao Ma,Jia-Bin Huang,Xiaokang Yang,Ming-Hsuan Yang 机构:National Tsing Hua Universit
Used for periodic real timetasks, eg. Videoencoding/decoding
WebRTC 只是一个媒体引擎,上面有一个 JavaScript API,所以每个人都知道如何使用它(尽管浏览器实现仍然各不相同),本文对 WebRTC(网页实时通信)的相关内容进行简要介绍。
实时SQL监控功能(Real-Time SQL Monitoring)是Oracle11g推出的功能,通过这个功能可以实时地监视执行中的SQL性能。
推荐使用:YOLOX + ROS2 object detection package
YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法,近期该文作者又对此进行了扩展,提出YOLACT++:Better Real-time Instance Segmentation,其 resnet50 模型在Titan Xp 上运行速度达 33.5 fps,在COCO 的test-dev数据集上达到34.1 mAP,并开源了代码。
Despite growing awareness of edge computing, there still lies a big misconception that the edge is simply an extension of the cloud.
【1】 ReLMM: Practical RL for Learning Mobile Manipulation Skills Using Only Onboard Sensors 标题:ReLMM:仅使用车载传感器学习移动操作技能的实用RL
Jason Perlow, Editorial Director at theLinux Foundation interviews Thomas Gleixner, Linux Foundation Fellow, CTO ofLinutronix GmbH, and project leader of the PREEMPT_RT real-timekernel patch set.
自动驾驶汽车可能仍然难以理解人类和垃圾桶之间的区别,但这并没有使最先进的物体检测模型在过去十年中取得的惊人进步相去甚远。
Analysis of requirement specification of parking management system
选自TowardsDataScience 作者:Léo Beaucourt 机器之心编译 参与:李诗萌、路雪 本文展示了如何使用 Docker 容器中的 TensorFlow 目标检测 API,通过网
声卡: win10 电脑自带声卡、罗技USB摄像头声卡、Android手机自带声卡都可以获取声音数据 摄像头: 手机摄像头、罗技USB摄像头
今天新出了14篇CVPR2019的论文,CV君汇总了他们的简略信息,有代码的也一并列出了,感兴趣的朋友,可以文末下载细读。
VIN 驱动可以分为 Kernel 层、Video Input Framework、Device Driver 层。
【导读】专知内容组整理了最近六篇目标跟踪(Object Tracking)相关文章,为大家进行介绍,欢迎查看! 1.Learning Dynamic Memory Networks for Object Tracking(学习动态记忆网络的目标跟踪) 作者:Tianyu Yang,Antoni B. Chan 机构:City University of Hong Kong 摘要:Template-matching methods for visual tracking have gained popular
第31届信息和知识管理国际会议CIKM2022将于2022年10月17日-21日以混合会议的方式在美国亚特兰大举行。CIKM会议是数据库/数据挖掘/内容检索领域顶级国际会议,也是中国计算机学会规定的CCF B类会议。关于该会议在历年推荐系统论文收录情况请参考下文:
Chris 工作于 TechSlice,他的主要工作包括 3D 图、AR 运动捕获以及利用 WebRTC 对这些技术进行部署。本次演讲从研究背景、风格转换的理论基础以及工程实现对视频的实时风格转换(Real-time Style Transfer)进行了介绍。
好多开发者在集成大牛直播SDK (官方)的Windows平台RTMP推送模块时吓一跳,怎么这么多接口?本文做个简单的拆分:
You hold your breath,quietly lying on the grass. The more and moreyelling and wheezing from your right. you clenched the fingers on the pan, trembling slightly. Just at the moment that a voice in the front approach you, you jump outof the grass, enemies k
去年最后一篇文章介绍了我们的 Electron 桌面客户端的一些优化措施,这篇文章也跟我们正在开发的 Electron 客户端有一定关系。最近我们正在预研在 Electron 页面中实时播放会议视频流的方案。
使用机器人操作系统ROS 2和仿真软件Gazebo 9服务进阶实战(八)- mobot行驶至目标位置
【1】 A Survey of Visual Transformers 标题:视觉Transformer综述 链接:https://arxiv.org/abs/2111.06091
论文 《Learning Hand-Eye Coordination for Robotic Grasping with Deep Learning and Large-Scale Data Collection》 last revised 28 Aug 2016 (this version, v4))
今天是SIGGRAPH Asia 2017的第三天,也是Poster papers讲解的最后一天(总共两天,每天中午13:00-14:00)。今年中了poster的文章总共有58篇,分为10个类别,分别有:Animation,Hardware,Image and Video,Interaction,Methods and Applications,Modeling,Multimedia,Rendering,Virtual Environments和Visualization。大部分的文章都附有演示的DEMO
Syntiant NDP(Neural Decision Processor)用于运行深度学习算法(deep learning algorithms)。
通知:这篇推文有10篇论文速递信息,涉及目标检测、行人重识别Re-ID、图像检索和Zero-Shot Learning等方向 这篇文章本来是在2018-03-10推送的,但由于内容编辑出了问题,便忍痛删除了,让大家久等一天,在此说声抱歉! 先附上前三天的论文速递文章: [计算机视觉论文速递] 2018-03-09 [计算机视觉论文速递] 2018-03-07 [计算机视觉论文速递] 2018-03-06 [1]《Domain Adaptive Faster R-CNN for Object Detec
大家好,又见面了,我是你们的朋友全栈君。 在线代码编辑器 在线编辑各种文本形式的源代码,如js,html,php等,要支持语法高亮,即时输入即时高亮。 我的初步想法是用一个 来实现,就是类似于常见的在线网页编辑器,但是因为仅仅是需要代码编辑,所以,要控制只能输入文本,不能让用户插入图片啊链接啊等等东西,感觉比较难。 希望大家能够探讨一下如何实现。 Bespin是一个用Canvas实现的在线代码编辑器,所以不支持IE,而且,因为是Canvas模拟编辑,效率很低,反应迟钝。 https://bespin.mozilla.com/
在Autodesk官网上看到一篇很好的讲述PCB发展历史的文章,同时也是一步人类近代科技发展的回顾,转发在此,点击左下角的“阅读原文”可以跳转到Autodesk的文章页面。
Detection PASCAL VOC 2009 datasetClassification/Detection Competitions, Segmentation Competition, Person Layout Taster Competition datasetsLabelMe datasetLabelMe is a web-based image annotation tool that allows researchers to label images and share the
本文记录IOS平台下基于FFmpeg的视频解码器。该示例C语言的源代码来自于《最简单的基于FFMPEG+SDL的视频播放器》。相关的概念就不再重复记录了。
You Only Look Once: Unified, Real-Time Object Detection Abstract We present YOLO, a new approach to
FFmpeg_allluckly.cn.png 新建工程,导入由Mac编译ffmpeg获取FFmpeg-iOS编译好的FFmpeg-iOS,然后导入系统依赖的库 AudioToolbox.framework CoreMedia.framework VideoToolbox.framework libiconv.tbd libbz2.tbd libz.tbd 编译的时候报错: 'libavcodec/avcodec.h' file not found ,修改Header search paths 里的路径:
随着ARM芯片技术的高速更新迭代,越来越多工业应用场景都使用ARM架构实现,ARM既可跑操作系统(Linux、FreeRTOS等)满足复杂应用需求,亦可跑裸机满足高实时等应用需求。由于ARM生态系统十分完善,因此在人机交互、网络通信、文件系统管理方面,有着得天独厚的优势。
简单介绍几个比较有代表性的工作, 分为以下几类: I. 相机重定位(Relocalization) Deep Learning 和 SLAM 结合的开山之作 ,剑桥的论文:PoseNet 。该方法
项目地址:https://github.com/anandpawara/Real_Time_Image_Animation
领取专属 10元无门槛券
手把手带您无忧上云