前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR2024 | 视频插帧视觉效果新突破!上海交大提出PerVFI,视频插帧新范式

CVPR2024 | 视频插帧视觉效果新突破!上海交大提出PerVFI,视频插帧新范式

作者头像
CV君
发布2024-06-17 13:54:36
2670
发布2024-06-17 13:54:36
举报

分享一篇来自CVPR2024的视频插帧工作《Perception-Oriented Video Frame Interpolation via Asymmetric Blending》。

该论文提出的视频插帧算法PerVFI在视觉效果上实现了新的突破。同时,论文阐述了新的视频插帧范式,有效解决现有插帧算法的痛点。

  • 论文地址:

https://openaccess.thecvf.com/content/CVPR2024/html/Wu_Perception-Oriented_Video_Frame_Interpolation_via_Asymmetric_Blending_CVPR_2024_paper.html

  • 论文代码:

https://github.com/mulns/PerVFI

技术背景

视频插帧技术一直是视频处理中的关键任务之一。给定特定时刻的视频图像(参考帧),视频插帧技术旨在合成中间时刻的图像,从而将低帧率的视频转化为高帧率视频。视频插帧技术可以被广泛用于多媒体行业,例如视频生成、视频质量优化、视频剪辑等。

现存问题

尽管基于神经网络的视频插帧技术正在快速更新优化,现有的算法仍然面临以下问题:生成的视频普遍存在模糊、重影问题。这篇论文总结这类问题的产生原因如下:

1.对无法避免的运动误差考虑不足。无论使用光流算法还是插帧算法自带的运动估计器,都无法避免会存在运动误差,尤其是在图像运动幅度较大的情况下。在此情况下不加以特别处理的话,容易出现重影问题。

2.由于训练数据中的ground-truth图像并不是唯一解,且存在与目标时间不对齐的问题。在此情况下,训练时使用重建损失容易导致结果模糊。

解决方案(新范式)

  1. 针对运动误差:由于本文专注于提升合成视频的视觉质量,因此物体运动上存在一定程度上的偏移是可以接受的。然而,这种偏移会导致从不同参考帧映射到时间t的特征不对齐。因此,相比简单地将不对齐特征进行自适应融合(对称融合),本文提出的利用稀疏约束来进行非对称融合的方法,可以有效缓解重影现象。
  2. 针对监督信号时域不对齐:采用Normalizing flow-based Network作为生成器,学习监督信号的分布,从而解决解空间不唯一导致的模糊问题,重建出清晰的结果。

网络结构

  1. ASB模块为新设计的非对称融合模块,利用稀疏化的权重Mask来控制信息融合的非对称性。PAM为特征对齐模块,ADM为权重掩码的合成模块。
  2. 在获得了融合的多尺度特征之后,利用Normalizing Flow-based Network来进行条件生成。这是一个可逆网络,正向/反向分别代表Encoding/Decoding过程。

实验效果

在面向感知的图像质量评价指标LPIPS和视频插帧质量评价指标FloLPIPS、VFIPS上,PerVFI算法都远优于其他算法。

更多视觉质量可视化可以参考项目主页:

https://mulns.github.io/pervfi-page/

未来工作

  1. 由于这篇文章重点在于提出一种新的范式,因此网络结构上有很大的优化空间,可以通过进一步改良各模块结构来达到更高的效率和性能。
  2. 文章中网络的训练仅使用了Vimeo90K数据集,便获得了较好的泛化能力。后续可以通过质量数量更优的数据集训练来进一步提升性能。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 技术背景
  • 现存问题
  • 解决方案(新范式)
  • 网络结构
  • 实验效果
  • 未来工作
相关产品与服务
媒体处理
媒体处理(Media Processing Service,MPS)是一种云端音视频处理服务。基于腾讯多年音视频领域的深耕,为您提供极致的编码能力,大幅节约存储及带宽成本、实现全平台播放,同时提供视频截图、音视频增强、内容理解、内容审核等能力,满足您在各种场景下对视频的处理需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档