攥稿人:linolzhang
编辑: Amusi
出处:https://zhuanlan.zhihu.com/p/34716633
前戏
今天Amusi很荣幸邀请linolzhang大佬分享关于深度学习的行人重识别方向相关论文整理的文章。文中介绍的论文都来自于CVPR(计算机视觉顶级会议)。
首先简单介绍一下,什么叫行人重识别?
行人重识别(Person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。
正文
预料之中,CVPR2018的文章大爆发,初步统计有30几篇,风口即将点燃,大家一起努力!
>> 文章列表(上):
1. Pose Transferrable Person Re-Identification
2. Deep Spatial Feature Reconstruction for Partial Person Re-identification: Freestyle Approach
3. Adversarially Occluded Samples For Improving Generalization of Person Re-identification Models
4. Harmonious Attention Network for Person Re-Identification
5. Dual Attention Matching Network for Context-Aware Feature Sequence based Person Re-Identification
6. Transferable Joint Attribute-Identity Deep Learning for Unsupervised Person Re-Identification
7. Camera Style Adaptation for Person Re-identfication
8. Image-Image Domain Adaptation with Preserved Self-Similarity and Domain-Dissimilarity for Person Re-identification
9. Person Transfer GAN to Bridge Domain Gap for Person Re-Identification
10. Unsupervised Cross-dataset Person Re-identification by Transfer Learning of Spatial-Temporal Patterns
>> 简要介绍
1. Pose Transferrable Person Re-Identification
来自 上海交大的一篇文章
算法要点:
一种Data Augment方法,通过引入Pose样本库,借助GAN进行多姿态的标签样本生成,用于辅助训练(可以用在其他领域)。
提出了一种基于姿态迁移的Re-ID框架,包括3个Key Point:
1) 通过将MARS数据集进行姿态转换,得到姿态丰富的训练样本,并加入到目标数据集进行训练;
2) 在传统的GAN的Discriminator(辨别器)的基础上,提出了一个引导子网络,生成更满足Re-ID Loss的样本;
网络描述为:Generator-Guider-Discriminator
3) 提出一种可选的优化过程来训练
所提出的网络,在没有可以设计re-id模型的情况下,效果超过了目前的state-of-the-art方法。
GAN在行人样本生成上已有成功的应用(郑良组),但是有几个问题:
1) 生成样本不具有足够的辨识信息,对于模型训练帮助不大;
GAN只试图产品视觉上好看的图片。
2) 复杂形状的生成,产生严重的扭曲,有些背离真实;
Ø 辅助标签样本生成
Appearance + pose -> Transfer–> Augment Samples
加入Guider,通过ReID的loss来约束生成的Samples。这个想法虽然简单,但是有效。
数据训练:
通过将生成的数据加入到训练集中,进行ReID模型训练,这样对于每个instance,都存在更多的姿态(表达能力更强),当然这样做的缺点在于通过GAN得到的模型本身不能正确的表示目标,如果过多使用,可能会导致准确度下降,为了避免这个问题,采用软标签(soft labeling)的形式来标记生成对象,即按照一定的概率进行Label的分类,不具体展开。
实验效果:
可以看到,在多个数据集上都有提升,是个不错的思路!
下一步的提升方向可以考虑更好的样本生成方法,这个应该是没有止境的。
2. Deep Spatial Feature Reconstruction for Partial Person Re-identification: Freestyle Approach
来自自动化所 孙哲南 组
主要针对 partial re-id问题,有遮挡的情况下的重识别问题。
算法通过CNN网络进行 图像空域重建,得到与输入图像尺寸一致的空域特征图,不需要特征对齐过程,算法借鉴字典学习中重建误差来计算不同的空域特征图的相似度。
卷积网络 与 空域特征图重建
与Triplet类似,采用End-to-end的训练方式,提高来自同一个id的样本相似度,降低不同id图像相似度。
算法在 Partial REID,Partial iLIDS 上的曲线相当不错(下图红色)。
False Positive曲线
--------我是可爱的分割线--------
领取专属 10元无门槛券
私享最新 技术干货