作者:Thomas Golda,Tobias Kalb,Arne Schumann,Jürgen Beyerer
摘要:最近,人体姿态估计在采用深度卷积神经网络方面取得了重大进展。它的许多应用近年来引起了极大的兴趣。然而,许多实际应用需要对人群进行姿态估计,这仍然是一个很少解决的问题。在这项工作中,我们探索了优化人群姿态估计的方法,重点关注密集人群引入的挑战,例如遮挡,彼此接近的人以及人的部分可见度。为了应对这些挑战,我们评估了姿势检测方法的三个方面:i)数据增强方法,以引入对遮挡的鲁棒性,ii)显着检测遮挡的身体部位,以及iii)使用合成的生成数据集。提高拥挤场景准确性的第一种方法是使用来自对象识别数据集COCO(上下文中的公共对象)的人和对象剪切在训练时生成遮挡。此外,评估合成生成的数据集JTA(联合跟踪自动)以用于现实世界的人群应用。为了克服源于低姿态变化和低密度人群的JTA的传输差距,创建扩展数据集以便于用于实际应用。另外,利用JTA提供的遮挡标记来训练模型,该模型明确地区分两个不同分支中的被遮挡和可见的身体部分。所提出的基线方法的增加的组合有助于将总体准确度提高4.7%AP,从而提供与相应数据集上的当前最新方法相当的结果。
原文标题:Human Pose Estimation for Real-World Crowded Scenarios
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。