场景边界检测是定位视频中场景起始位置的技术,作为视频语义理解的重要步骤,可应用于场景分类、视频检索与摘要等任务。在某中心研究团队发表于CVPR 2021的论文中,提出了名为ShotCoL的新型自监督场景边界检测算法。
ShotCoL采用对比学习框架,通过预设任务使模型学会区分相似/不相似的镜头样本:
与传统方法相比,ShotCoL的创新点包括:
该技术为长视频表征学习提供新思路,可推动动作定位、视频问答等需要高层语义理解任务的发展。研究团队将继续探索多模态视频理解技术,优化流媒体平台的观影体验。
相关论文:《基于镜头对比自监督学习的场景边界检测》
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。