基于运动目标三维轨迹重建的视频序列同步算法

文章来源：企鹅号 - 自动化学报

“

视频配准是计算机视觉领域中一个重要的基础问题。涉及多个时空关联视频的视觉应用通常需要首先执行视频配准，即通过联合估计时间空间映射，将多个图像序列注册到统一的时间空间中，例如动作识别、基于内容的视频检索、多视频监控以及三维重建与可视化等。

为了降低问题的复杂度，研究者们提出各种假设以减少待估计参数的数目。假设相机静止或联合运动相机，则空间变换关系恒定不变。假设相机沿相似轨迹运动，则对应图像帧之间的相机运动可仅用旋转矩阵表示（忽略平移）。假设时域映射为线性关系，例如两序列间仅存在一个常数偏移量，或者帧率比不为1，则可以用一个简单的参数化模型来描述该类时域映射。此外，关于算法的输入，现有算法一般假设特征点跟踪持续整个图像序列，且序列之间的特征点对应关系已知。然而，实际问题要远比这复杂得多。首先，对于自由运动相机和非刚性动态场景（多个运动目标）来说，由于遮挡、运动模糊、复杂背景、超出视野范围等原因，要在多个视频中做到长时间精确跟踪同一个特征点是十分困难的，在某些情况下甚至是不可能的。其次，在成像面上投影形成的光流是由相机自运动和目标运动共同产生的，如何对光流解耦，消除相机自运动的影响，从而得到序列时域配准的线索——目标运动，这是一个病态问题。另外，线性时域映射也无法处理非均匀时域采样、丢帧等问题。

图 1第一人称视角图像序列通过非线性映射实现时域配准

Fig.1 Two video sequences caputered by first-person cameras are temporally aligned via a nonlinear transformation

如图1所示，针对同时空采集模式（多个相机在同一个时间空间中从不同视角对某个动态场景进行记录），本文提出一种基于运动目标三维轨迹重建的多视频时域配准算法。其主要思路是基于轨迹基函数重建目标的三维轨迹，然后利用不同序列重建的三维运动轨迹来同步图像序列。我们提出一种基于轨迹基系数的秩约束，结合基于图的最优路径搜索算法，实现视频间的非线性时域配准。该方法不要求跟踪特征点轨迹持续整个序列，也不依赖已知的序列间点对应关系。本文在仿真数据和真实数据集上验证了提出方法的鲁棒性和性能。

引用格式

王雪, SHI Jian-Bo, PARK Hyun-Soo, 王庆. 基于运动目标三维轨迹重建的视频序列同步算法. 自动化学报, 2017, 43(10): 1759-1772

作者简介

王雪西北工业大学计算机学院博士研究生. 主要研究方向为目标跟踪, 人体行为分析.

SHI Jian-Bo 宾夕法尼亚大学工程与应用科学学院教授. 主要研究方向为人体行为分析, 图像识别分割.

PARK Hyun-Soo 宾夕法尼亚大学工程与应用科学学院博士后. 主要研究方向为基于视觉社交信号的人体交互行为分析, 如注意力运动、面部表情和身体姿势等.

王庆西北工业大学计算机学院教授. 主要研究方向为计算机视觉, 图像与视频处理, 光场成像, 虚拟现实. 本文通信作者.

欢迎关注

发表于: 2018-01-082018-01-08 09:23:35
原文链接：http://kuaibao.qq.com/s/20180108B0OK3W00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

基于运动目标三维轨迹重建的视频序列同步算法

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐