首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

打打字就能指挥算法视频抠图,Transformer掌握跨模态新技能,精度优于现有模型丨CVPR 2022

点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 都说Transformer适合处理多模态任务。 这不,在视频目标分割领域,就有人用它同时处理文本和视帧,提出了一个结构更简单、处理速度更快(每秒76帧)的视频实例分割框架。 这个框架只需一串文本描述,就可以轻松将视频中的动态目标“抠”出来: 可以实现端到端训练的它,在基准测试中的多个指标上表现全部优于现有模型。 目前,相关论文已被CVPR 2022接收,研究人员来自以色列理工学院。 主要思路 根据文本描述进行视频目标分割这一多模态任务(R

02

自导自演皮克斯动画不再是梦,这个工具实现了高分辨率、高度可控的真人视频转动画

机器之心报道 编辑:张倩 这个框架能将人物视频转成动画,还是高清、高度可控的。 在社交网络、短视频平台上使用卡通头像录制视频是很多人喜欢的玩法,但我们也会发现一些问题,比如头像调整范围比较窄,和本人没有那么像等。 近日,来自新加坡南洋理工大学的一项相关研究在 reddit、推特上都收获了上千的点赞量。他们开发了一个能够进行可控高分辨率人像视频风格转换的框架——VToonify,在风格控制的灵活性、生成视频的质量、时间上的连贯性等方面都有着出色的表现。 你可以根据自己的需要灵活调整生成的风格类型以及卡通化的

04

建造自己的「天空之城」,密歇根大学博士后的这项研究可以虚空造物、偷天换日

机器之心报道 机器之心编辑部 看过宫崎骏动画电影《天空之城》的小伙伴,想必偶尔会向往那座神秘的空中岛屿拉普达吧。近日,密歇根大学安娜堡分校博士后研究员 Zhengxia Zou 进行了一项研究,不仅可以创建空中堡垒,更可以转变场景中的天气和光照,让你有身临其境的感觉。此外,这项研究完全基于视觉,能够很好地应用于在线或离线场景,且可以执行实时处理。 哈尔的移动城堡?天空之城?这幅图是否让你想起了这两部电影中的场景…… 上:《天空之城》剧照;下:《哈尔的移动城堡》剧照。 是电影场景变为现实了吗?真的有人建造

01
领券