前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

作者头像
新智元
发布于 2020-07-24 07:30:11
发布于 2020-07-24 07:30:11
2.8K0
举报
文章被收录于专栏:新智元新智元

新智元报道

来源:arxiv

编辑:雅新

【新智元导读】谷歌研究人员最近在CVPR 2020上发表的一篇论文提出了用于边缘设备上运行的单人人体姿态估计算法BlazePose。该算法在中端手机CPU上的性能比20核桌面CPU上的OpenPose还要快25-75倍。

根据图像或视频进行人体姿势估计在如健康跟踪、手语识别等实际应用中起着核心作用。由于个体会做出各种各样的姿势,此任务具有极大的挑战性。

谷歌研究人员最近在 CVPR 2020 上发表的一篇论文提出了用于边缘设备上运行的单人人体姿态估计算法BlazePose。

在推断过程中,采用推断身体33个关键点的轻量卷积网络,用编解码器直接推断边框,并在Pixel 2手机上推断速度可达到30fps。BlazePose在中端手机CPU上性能比20核桌面CPU上的OpenPose还要快25-75倍。

论文地址:https://arxiv.org/pdf/2006.10204.pdf

用面部检测器代替身体检测器,速度超OpenPose

最近的研究工作在姿势估计方面有了重大进展。而这些进展大都采用的方法是为每个关节生成热图以及每个坐标精炼偏移量。

虽然这种选择的热图可以扩展到多个人,但它使一个人的模型比适用于手机上的实时推断的模型大得多。而谷歌研究人员在此解决了这个特殊的用例,并演示了该模型的显著加速,而几乎没有质量下降。

与基于热图的技术相比,基于回归的方法虽然对计算的要求较低且可扩展性更高,但它们试图预测平均坐标值,但往往无法解决潜在的歧义。

研究人员在人体姿态估计上和之前的做法有很大的不同。

使用面部检测器而不是人体检测器检测人体。研究人员发现,由于使用身体检测器容易受场景中密集人群遮挡的影响,如果在遮挡严重状态下,身体检测器的信任值不会很高。

但是人的脸部比起全身就不容易被遮挡,而且在神经网络中这一部分的响应值往往是最高的。

网络是有两个部分组成,分别是关键点检测部分和关键点回归部分。这个网络新颖的地方在于,在训练阶段,关键点检测和回归一起训练。在测试的时候,去掉检测部分,仅保留回归部分,这样可以加快运行速度。

研究人员通过实验证明了这种方法在大幅加速的同时也没有损失精度,网络结构如下:

除此之外,研究人员在训练阶段根据模型的应用场景,针对性的对数据增强部分做了限制,这样降低了模型学习复杂场景的能力,但能让模型更快的去学习真实场景下的数据。除了姿势检测部分,整体模型还包含了一个pose tracker用来做跟踪。

如果在当前姿势检测器能够预测到下一帧中姿势位置的时候,姿势检测器就不会运行,会一直使用姿势追踪器的结果,否则就会运行检测器,并重新初始化追踪器。

研究人员最后在自己创建的数据集上,将自己的模型和OpenPose的做了比较,速度远超OpenPose精度略差。

研究人员开发了这种新的,在设备上单人特定的人体姿势估计模型,可以支持各种性能要求高的用例,例如手势,健身跟踪和AR。该模型在移动CPU上几乎实时工作,并且可以在移动GPU上加快超实时延迟。

研究人员表示,「即使参数数量较少,堆叠式沙漏架构也可以显着提高预测质量。我们在工作中扩展了这个想法,并使用编码器-解码器网络体系结构预测所有关节的热图,然后使用另一个编码器直接回归到所有关节的坐标。我们工作背后的关键点是可以在推理过程中丢弃热图分支,使其足够轻巧,可以在手机上运行。

参考链接:

https://arxiv.org/abs/2006.10204

https://www.arxiv-vanity.com/papers/2006.10204/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
关于大片人物特效少不了的人体姿态估计,这里有一份综述文章
人体姿态骨架图 (skeleton) 用图形格式表示人的动作。本质上,它是一组坐标,连接起来可以描述人的姿势。骨架中的每个坐标都被称为这个图的部件(或关节、关键点)。我们称两个部件之间的有效连接为对(pair,或肢)。但是要注意的是,并非所有部件组合 都能产生有效的对。下图是一个人体姿态骨架图的示例。
机器之心
2019/06/14
1.3K0
关于大片人物特效少不了的人体姿态估计,这里有一份综述文章
ICCV 2019 | 一种基于卷积神经网络的驾驶员和安全带检测的灵活体系结构
作者 | BBuf 单位 | 北京鼎汉技术有限公司 算法工程师(CV) 编辑 | 唐里
AI科技评论
2019/10/25
2.1K0
ICCV 2019 | 一种基于卷积神经网络的驾驶员和安全带检测的灵活体系结构
实时检测17个人体关键点,谷歌SOTA姿态检测模型,手机端也能运行
机器之心报道 编辑:陈 近日,来自谷歌的研究者更新了用于实时姿态检测的项目,该项目包含 3 种 SOTA 模型,其中 MoveNet 模型可检测人体 17 个关键点、并以 50+ fps 在电脑和手机端运行;BlazePose 可检测人体 33 个关键点;PoseNet 可以检测人体多个姿态,每个姿态包含 17 个关键点。 不久之前谷歌研究院推出了最新的姿态检测模型 MoveNet,并在 TensorFlow.js 中推出了新的姿态检测 API,该模型可以非常快速、准确地检测人体的 17 个关键节点。这一
机器之心
2023/03/29
3.6K0
实时检测17个人体关键点,谷歌SOTA姿态检测模型,手机端也能运行
基于深度学习的单目人体姿态估计方法综述(一)
原文:Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods
计算机视觉
2021/03/16
1.8K0
深度学习人体姿态估计:2014-2020全面调研
来自北卡夏洛特, 戴顿大学, 德州大学达拉斯分校,中佛罗里达大学的研究人员对该领域的研究发展进行了综述。基于输入数据和推理程序的系统分析和比较,作者对基于深度学习的 2D 和 3D 姿态估计解决方案进行全面回顾,其中涵盖了自2014 年以来 240 余篇相关研究论文。同时还提供了定期更新的 github 项目。
CV君
2021/02/05
1.5K0
深度学习人体姿态估计:2014-2020全面调研
[深度学习 – 实战项目] 行为识别——基于骨架提取/人体关键点估计的行为识别
我们可以通过深度学习,检测到一个人,但是那个人在做什么我们不知道。所以我们就想让神经网络既检测到人,又知道他在做什么。也就是对这个人的行为进行识别。
全栈程序员站长
2022/08/31
4.7K0
[深度学习 – 实战项目] 行为识别——基于骨架提取/人体关键点估计的行为识别
深度学习中的“人体姿势估计”全指南
来源商业新知网,原标题:从DeepNet到HRNet,这有一份深度学习“人体姿势估计”全指南
商业新知
2019/05/08
3.4K0
深度学习中的“人体姿势估计”全指南
关键点定位︱四款人体姿势关键点估计论文笔记
版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! https://blog.csdn.net/sinat_26917383/article/details/79704097
悟乙己
2019/05/26
2.8K0
从DeepNet到HRNet,这有一份深度学习“人体姿势估计”全指南
几十年来,人体姿态估计(Human Pose estimation)在计算机视觉界备受关注。它是理解图像和视频中人物行为的关键一步。
大数据文摘
2019/05/15
1.7K0
从DeepNet到HRNet,这有一份深度学习“人体姿势估计”全指南
基于置信度的自上而下的多人姿态估计与跟踪方法
由于近年来目标检测器的进步,自上而下的流程已经取得了巨大进步,并已成为主流。然而,遮挡和快速运动是阻碍这些方法完美的两个障碍。自上而下的方法根据由姿态估计器预测的热图过滤关键点,这些估计器针对图像而非视频帧进行优化。估计器受到运动模糊的影响,因此很难产生准确的关节点。此外,相邻人员之间的遮挡可能会误导估计器做出错误的预测。
是Dream呀
2025/03/11
1280
基于置信度的自上而下的多人姿态估计与跟踪方法
目标检测+姿态识别:AI助力奥运公平公正打分,不再给日本奥运黑哨的机会(附源代码)
‍‍‍‍‍‍‍日本人多次犯规,裁判却视而不见,这是对所有参赛选手的不公。在日本举行奥运会就要护着日本?
计算机视觉研究院
2022/01/25
1.2K0
目标检测+姿态识别:AI助力奥运公平公正打分,不再给日本奥运黑哨的机会(附源代码)
加盟依图科技后,颜水成首篇顶会论文提出“高效多人体姿态检测SPM”
这篇论文从全新的角度处理了单图像多人姿态检测的问题,通过新提出的结构化位姿表示方法(Structured Pose Representation)将多人姿态检测问题从先前的两阶段方法浓缩为单阶段检测,大幅度提高了人体位姿检测的效率和精度。
量子位
2019/09/17
4930
加盟依图科技后,颜水成首篇顶会论文提出“高效多人体姿态检测SPM”
神“乐”马良:AI直接将音频转换成动画
【新智元导读】根据音乐信号预测身体的运动是一个极具挑战性的计算问题。来自Facebook、斯坦福大学和华盛顿大学的研究人员开发了一种基于深度学习的方法,该方法可以将乐器的声音转换成对骨骼关键点的预测,并可以用于制作动画角色。
新智元
2018/07/31
1.4K0
神“乐”马良:AI直接将音频转换成动画
姿态估计开源模型、数据集分享
姿态估计是一种计算机视觉技术,旨在从图像或视频中识别和理解人体的姿势或动作。它涉及检测人体的关键点,如头部、肩膀、手臂、腿部等,并确定它们之间的关系,以推断出人体的姿势或动作。
CV君
2024/06/28
6640
姿态估计开源模型、数据集分享
谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪
---- 新智元报道   作者:Ivan Grishchenko & Valentin Bazarevsky 【新智元导读】谷歌MediaPipe Holistic为突破性的 540 多个关键点(33 个姿势、21 个手和468 个人脸关键点)提供了统一的拓扑结构,并在移动设备上实现了近乎实时的性能。 在移动设备上对人体姿势、人脸关键点和手部追踪的实时同步感知,可以实现各种有趣的应用,如健身和运动分析、手势控制和手语识别、增强现实效果等。 谷歌之前发布的 MediaPipe 就是一个专门为GPU或CP
新智元
2023/05/22
1.7K0
谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪
CVPR2021:单目实时全身动作捕捉(清华大学)
Monocular Real-time Full Body Capture with Inter-part Correlations
3D视觉工坊
2021/05/18
8810
CVPR2021:单目实时全身动作捕捉(清华大学)
与其撩妹尬舞,倒不如跟AI学跳舞
作者 | Caroline Chan、Shiry Ginosar、Tinghui Zhou 和 Alexei A. Efros
AI科技大本营
2018/09/28
9790
与其撩妹尬舞,倒不如跟AI学跳舞
[计算机论文速递] 2018-03-23
通知:这篇文章有15篇论文速递信息,涉及目标检测、目标跟踪、姿态估计、SLAM、GAN、行为识别、去雾、网络优化等方向 创办CVer公众号,渐渐半个多月了,很感谢得到这么多童鞋的关注和支持。特别是看到后台有人给我留言:加油,我很喜欢你的公众号。我心里很满足,也很有动力。 我尽量维持1.5day频率的更新速度,但写一篇推文确实太耗时间了,哪怕暂时是以“译文”为主的文章。在此向那些奉献知识的工作者表示致敬。 最近有同学建议我,可以开启打赏功能,分享知识的同时,获得物质上的赞赏,也是作为对你的工作一种肯定。我没有
Amusi
2018/04/12
9940
[计算机论文速递] 2018-03-23
使用MediaPipe进行设备上的实时手部跟踪
能够感知手的形状和运动,这是改善各种技术领域和平台的用户体验的重要组成部分。例如,它可以形成手语理解和手势控制的基础,并且还可以在增强现实中实现物理世界之上的数字内容和信息的叠加。虽然对人们来说很自然,强大的实时手感是一项极具挑战性的计算机视觉任务,因为手经常遮挡自己或彼此(例如手指/手掌闭塞和手抖)并且缺乏高对比度模式。
代码医生工作室
2019/08/23
9.9K4
使用MediaPipe进行设备上的实时手部跟踪
用TensorFlow.js进行人体姿态估计:在浏览器中即可实时查看人体姿态
在与谷歌创意实验室的合作,我很高兴地宣布的发行TensorFlow.js版本PoseNet 机器学习模型,它允许在浏览器中实时估计人类姿态。在这里试试现场演示(链接在文末)。
AiTechYun
2018/07/27
5.4K0
用TensorFlow.js进行人体姿态估计:在浏览器中即可实时查看人体姿态
推荐阅读
关于大片人物特效少不了的人体姿态估计,这里有一份综述文章
1.3K0
ICCV 2019 | 一种基于卷积神经网络的驾驶员和安全带检测的灵活体系结构
2.1K0
实时检测17个人体关键点,谷歌SOTA姿态检测模型,手机端也能运行
3.6K0
基于深度学习的单目人体姿态估计方法综述(一)
1.8K0
深度学习人体姿态估计:2014-2020全面调研
1.5K0
[深度学习 – 实战项目] 行为识别——基于骨架提取/人体关键点估计的行为识别
4.7K0
深度学习中的“人体姿势估计”全指南
3.4K0
关键点定位︱四款人体姿势关键点估计论文笔记
2.8K0
从DeepNet到HRNet,这有一份深度学习“人体姿势估计”全指南
1.7K0
基于置信度的自上而下的多人姿态估计与跟踪方法
1280
目标检测+姿态识别:AI助力奥运公平公正打分,不再给日本奥运黑哨的机会(附源代码)
1.2K0
加盟依图科技后,颜水成首篇顶会论文提出“高效多人体姿态检测SPM”
4930
神“乐”马良:AI直接将音频转换成动画
1.4K0
姿态估计开源模型、数据集分享
6640
谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪
1.7K0
CVPR2021:单目实时全身动作捕捉(清华大学)
8810
与其撩妹尬舞,倒不如跟AI学跳舞
9790
[计算机论文速递] 2018-03-23
9940
使用MediaPipe进行设备上的实时手部跟踪
9.9K4
用TensorFlow.js进行人体姿态估计:在浏览器中即可实时查看人体姿态
5.4K0
相关推荐
关于大片人物特效少不了的人体姿态估计,这里有一份综述文章
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档