首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenVINO + OpenCV实现点头与摇头识别验证

OpenVINO + OpenCV实现点头与摇头识别验证

作者头像
OpenCV学堂
发布于 2020-11-06 02:40:59
发布于 2020-11-06 02:40:59
1.9K00
代码可运行
举报
运行总次数:0
代码可运行

模型介绍

OpenVINO支持头部姿态评估模型,预训练模型为:head-pose-estimation-adas-0001,在三个维度方向实现头部动作识别,它们分别是:

pitch是俯仰角,是“点头“

yaw是偏航角,是‘摇头’

roll是旋转角,是“翻滚

它们的角度范围分别为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
YAW [-90,90], PITCH [-70,70], ROLL [-70,70]

这三个专业词汇其实是来自无人机与航空领域,计算机视觉科学家一大爱好就是搞新词,就把它们借用到头部姿态评估中,它们的意思图示如下:

对应到头部姿态评估中

输入格式:[1x3x60x60] BGR顺序

输出格式:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
name: "angle_y_fc", shape: [1, 1] - Estimated
name: "angle_p_fc", shape: [1, 1] - Estimated pitch
name: "angle_r_fc", shape: [1, 1] - Estimated roll

代码演示

01

人脸检测

基于OpenVINO中MobileNetv2 SSD人脸检测模型,实现人脸检测,然后得到ROI区域,基于ROI实现头部姿态评估,完成头部动作识别,这里只会识别幅度超过正负20度以上的头部动作。实现模型加载与输入输出格式解析的代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 1ie = IECore()
 2for device in ie.available_devices:
 3    print(device)
 4
 5net = ie.read_network(model=model_xml, weights=model_bin)
 6input_blob = next(iter(net.input_info))
 7out_blob = next(iter(net.outputs))
 8
 9n, c, h, w = net.input_info[input_blob].input_data.shape
10print(n, c, h, w)
11
12# cap = cv.VideoCapture("D:/images/video/Boogie_Up.mp4")
13cap = cv.VideoCapture("D:/images/video/example_dsh.mp4")
14# cap = cv.VideoCapture(0)
15exec_net = ie.load_network(network=net, device_name="CPU")
16
17em_net = ie.read_network(model=em_xml, weights=em_bin)
18em_input_blob = next(iter(em_net.input_info))
19em_it = iter(em_net.outputs)
20em_out_blob1 = next(em_it)  # angle_y_fc
21em_out_blob2 = next(em_it)  # angle_p_fc
22em_out_blob3 = next(em_it)  # angle_r_fc
23print(em_out_blob1, em_out_blob2, em_out_blob3)
24en, ec, eh, ew = em_net.input_info[em_input_blob].input_data.shape
25print(en, ec, eh, ew)
26
27em_exec_net = ie.load_network(network=em_net, device_name="CPU")

02

实现头部动作检测

解析模型的输出,对视频流实现人脸检测与头部动作识别的代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 1height = cap.get(cv.CAP_PROP_FRAME_HEIGHT)
 2width = cap.get(cv.CAP_PROP_FRAME_WIDTH)
 3count = cap.get(cv.CAP_PROP_FRAME_COUNT)
 4fps = cap.get(cv.CAP_PROP_FPS)
 5out = cv.VideoWriter("D:/test.mp4", cv.VideoWriter_fourcc('D', 'I', 'V', 'X'), 15, (np.int(width), np.int(height)),
 6                     True)
 7while True:
 8    ret, frame = cap.read()
 9    if ret is not True:
10        break
11    image = cv.resize(frame, (w, h))
12    image = image.transpose(2, 0, 1)
13    inf_start = time.time()
14    res = exec_net.infer(inputs={input_blob: [image]})
15    inf_end = time.time() - inf_start
16    # print("infer time(ms):%.3f"%(inf_end*1000))
17    ih, iw, ic = frame.shape
18    res = res[out_blob]
19    for obj in res[0][0]:
20        if obj[2] > 0.75:
21            xmin = int(obj[3] * iw)-10
22            ymin = int(obj[4] * ih)-10
23            xmax = int(obj[5] * iw)+10
24            ymax = int(obj[6] * ih)+10
25            if xmin < 0:
26                xmin = 0
27            if ymin < 0:
28                ymin = 0
29            if xmax >= iw:
30                xmax = iw - 1
31            if ymax >= ih:
32                ymax = ih - 1
33            roi = frame[ymin:ymax, xmin:xmax, :]
34            roi_img = cv.resize(roi, (ew, eh))
35            roi_img = roi_img.transpose(2, 0, 1)
36            em_res = em_exec_net.infer(inputs={em_input_blob: [roi_img]})
37            angle_p_fc = em_res[em_out_blob1][0][0]
38            angle_r_fc = em_res[em_out_blob2][0][0]
39            angle_y_fc = em_res[em_out_blob3][0][0]
40            postxt = ""
41            if angle_p_fc > 10 or angle_p_fc < -10:
42                postxt += "pitch, "
43            if angle_y_fc > 10 or angle_y_fc < -10:
44                postxt += "yaw, "
45            if angle_r_fc > 10 or angle_r_fc < -10:
46                postxt += "roll, "
47
48            cv.putText(frame, postxt, (xmin, ymin-10), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2)
49            cv.rectangle(frame, (xmin, ymin), (xmax, ymax), (0, 255, 255), 2, 8)
50            cv.putText(frame, "infer time(ms): %.3f" % (inf_end * 1000), (50, 50), cv.FONT_HERSHEY_SIMPLEX, 1.0,
51                       (255, 0, 255),
52                       2, 8)
53    cv.imshow("Face & head pose demo", frame)
54    out.write(frame)
55    c = cv.waitKey(1)
56    if c == 27:
57        break
58cv.waitKey(0)
59out.release()
60cap.release()

运行结果如下:

视频文件

这个建议感兴趣的可以尝试一下,把视频文件换成摄像头,基本上实时识别点头,摇头,转头等动作毫无压力,我自所以不用我自己的测试截图,主要把我自己长的太丑!另外速度实时!真的好用!

善学者,假人之长以补其短

推荐阅读

OpenCV4系统化学习路线图-视频版本!

Tensorflow + OpenCV4 安全帽检测模型训练与推理

汇总 | OpenCV DNN模块中支持的分类网络

OpenCV中支持的人脸检测方法整理与汇总

详解ENet | CPU可以实时的道路分割网络

从Pytorch 的ONNX到OpenVINO中IR中间层

OpenVINO中的FCOS人脸检测模型代码演示

详解OpenVINO 模型库中的人脸检测模型

效果特好 | OpenVINO手写数字识别

OpenVINO+OpenCV 文本检测与识别

OpenCV 基于Inception模型图像分类

OpenCV4.4 + YOLOv4 真的可以运行了…..

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
OpenVINO实时人脸表面3D点云提取
2019出现的一个可以在移动端实时运行的人脸3D表面提取模型-FaceMesh,被很多移动端AR应用作为底层算法实现人脸检测与人脸3D点云生成。相关的论文标题为:
OpenCV学堂
2021/05/07
1.1K0
OpenVINO实时人脸表面3D点云提取
OpenVINO中两个高分辨率的人脸检测模型
OpenVINO中提供了八个人脸检测的相关模型,其中有两个与剩余的六个是基于不同的对象检测头实现。今天这里就重点介绍一下这两个与众不同的人脸检测预训练模型的使用。 模型说明
OpenCV学堂
2021/11/16
6540
OpenVINO中两个高分辨率的人脸检测模型
OpenVINO + OpenCV实现车辆检测与道路分割
模型介绍 OpenVINO支持道路分割与车辆检测,预训练模型分别为: - road-segmentation-adas-0001 - vehicle-detection-adas-0002 其中道路分割模型的输出四个分类,格式如下: BG, road, curb, mark, 输出格式[NCHW]=[1x4x512x896] 车辆检测模型基于SSD MobileNetv1实现,输出格式为: NCHW = [1x1xNx7],其中N表示检测到boxes数目 代码演示 01 道路分割模型加载与推理 首先加载道
OpenCV学堂
2020/11/06
1.1K0
OpenVINO + OpenCV实现车辆检测与道路分割
OpenCV + OpenVINO实现人脸AR – 请戴上口罩
最近在看我之前的写的一篇关于人脸landmark的文章,里面有提到OpenVINO自带模型人脸的35个点位,有人问我这个landmark检测有什么用,我斗胆抛砖引玉一下,做了个简单的自动戴口罩的AR演示。
OpenCV学堂
2021/11/25
9130
OpenCV + OpenVINO实现人脸AR – 请戴上口罩
CPU上跑深度学习模型,FPS也可以达100帧
英特尔从去年推出OpenVINO开发框架,从此以后几乎每三个月就更新一个版本,最新版本2019R03,但是此版本跟之前的版本改动比较大,所以在配置Python SDK支持与开发API层面跟之前都有所不同。这里假设你已经正确安装好OpenVINO框架。如果不知道如何安装与配置OpenVINO可以看我在B站视频教程:
OpenCV学堂
2019/11/11
2.1K0
系列 | OpenVINO使用之行人属性识别
OpenVINO不仅通过其IE组件实现加速推理,其提供的预训练库还支持各种常见的图像检测、分割、对象识别等的计算机视觉任务。前面小编写过一系列的文章详细介绍过OpenVINO的各种应用,可以看这里回顾一下:
OpenCV学堂
2019/07/30
2.6K0
系列 | OpenVINO使用之行人属性识别
轻松学Pytorch –车辆类型与颜色识别
大家好,上一周没有给大家更新这个系列文章,不是我不想更新,而是很多数据需要我自己准备,做好处理,比如这次的车辆属性数据,基于BITVehicle_Dataset公开数据集的基础上,我用程序标注了9000多张车辆属性跟颜色数据集,用于本次训练。本文主要演示了如下一些知识点:
OpenCV学堂
2020/06/29
4.1K1
系列 | OpenVINO视觉加速库使用七
还用介绍吗,直接看下面的系列文章了解OpenVINO是干什么用的,还有如何与OpenCV一起使用,实现对DNN模块的加速运行,OpenVINO SDK开发使用等相关技术。
OpenCV学堂
2019/05/13
3.9K1
系列 | OpenVINO视觉加速库使用七
教程 | 100行代码搞定实时视频人脸表情识别
好就没有写点OpenCV4 + OpenVINO的应用了,前几天上课重新安装了一下最新OpenVINO2020.3版本,实现了一个基于OpenCV+OpenVINO的Python版本人脸表情识别。100行代码以内,简单好用!
OpenCV学堂
2020/07/08
2.6K0
OpenCV+OpenVINO实现人脸Landmarks实时检测
自从OpenCV3.3版本引入深度神经网络(DNN)模块之后,OpenCV对DNN模块支持最好的表现之一就是开始支持基于深度学习人脸检测,OpenCV本身提供了两个模型分别是基于Caffe与Tensorflow的,Caffe版本的模型是半精度16位的,tensorflow版本的模型是8位量化的。同时OpenCV通过与OpenVINO IE模型集成实现了底层硬件对对象检测、图像分割、图像分类等常见模型加速推理支持。OpenVINO框架本身提供直接快速开发应用原型的模型库,对很多常见视觉任务都可以做到快速演示支持。说起人脸的Lankmarks提取,最早的OpenCV跟DLib支持的方式都是基于AAM算法实现的68个人脸特征点的拟合模型,另外OpenCV中支持landmark的人脸检测会先加载一个很大的模型文件,然后速度感人,觉得还有很大的改进空间。好处是OpenCV自己提供了一个训练工具,可以自己训练模型。常见的MTCNN同时实现了人脸检测跟landmarks检测,但是只支持5点检测。而OpenVINO自带的Landmark检测模型基于自定义的卷积神经网络实现,取35个人脸各部位关键点。
OpenCV学堂
2020/04/14
2K0
OpenCV+OpenVINO实现人脸Landmarks实时检测
系列 | OpenVINO视觉加速库使用六
主要讲述如何把DrakNet框架下支持的YOLO系列模型通过OpenVINO模型优化器与推断引擎实现对YOLO网络模型的加速执行。完整实现YOLO模型在OpenVINO上运行可以分为两个部分
OpenCV学堂
2019/04/29
3.1K1
系列 | OpenVINO视觉加速库使用六
OpenVINO场景文字检测与识别
OpenVINO提供的场景文字检测模型准确率是非常的高,完全可以达到实用级别,其实OpenVINO还提供了另外一个场景文字识别的模型,总体使用下来的感觉是没有场景文字检测那么靠谱,而且只支持英文字母与数字识别,不支持中文,不得不说是一个小小遗憾,但是对比较干净的文档图像,它的识别准确率还是相当的高,速度也比较快,基本上都在毫秒基本出结果。
OpenCV学堂
2019/06/21
3.1K1
OpenVINO场景文字检测与识别
OpenVINO 2020R01 SDK的改动与应用开发演示
之前写了一篇OpenVINO2020R01版本中如何使用OpenCV深度神经网络模型实现模型推理加速,详细交代了相关配置与程序演示内容。
OpenCV学堂
2020/03/25
1.5K0
OpenVINO部署Mask-RCNN实例分割网络
OpenVINO支持Mask-RCNN与yolact两种实例分割模型的部署,其中Mask-RCNN系列的实例分割网络是OpenVINO官方自带的,直接下载即可,yolact是来自第三方的公开模型库。
OpenCV学堂
2021/03/12
8470
OpenVINO部署Mask-RCNN实例分割网络
OpenVINO开发教程之八 – 道路分割
基于OpenVINO预训练模块中的道路分割模型,实现像素级别的图像分割,把像素划分为如下四个类别
OpenCV学堂
2019/06/14
3K3
OpenVINO开发教程之八 – 道路分割
网络模型量化与推理加速框架OpenVINO最新版本SDK演示
英特尔从2018年发布OpenVINO 视觉框架之后,很多公司与开发者尝试之后,反馈良好。至今英特尔几乎每个季度都会更新一个小版本发布,最新发布的OpenVINO 2019R03版本,跟2018年的版本有了全方位的性能提升、SDK开发接口更加的易用易学,对开发者更加的友好。去年我记得我使用OpenVINO SDK开发应用程序的时候,经常被代码中的各种路径常量搞得晕头转向,吐槽这种加载IE的方式很让人无语,果然,今年都改好啦。而且更重要的是优化整个开发流程的SDK使用,使得整个工作流看上去更加合理,符合程序员的思维习惯。同时对各种硬件支持,更加的灵活方便,加强了可配置性。另外还有个值得惊喜的地方是支持INT8的模型量化啦,这个真的好!
OpenCV学堂
2019/10/30
1.5K0
网络模型量化与推理加速框架OpenVINO最新版本SDK演示
口罩检测识别率惊人,这个Python项目开源了
昨天在 GitHub 上看到一个有趣的开源项目,它能检测我们是否有戴口罩,跑起程序测试后,发现识别率挺高的,也适应不同环境,于是分享给大家。
AI科技大本营
2020/03/10
3.5K1
口罩检测识别率惊人,这个Python项目开源了
基于Aidlux平台的人脸关键点检测以及换脸算法
运行Aidlux中examples的自带Demo:人脸、人体、手关键点检测、头发语义分割、人像语义分割、人脸检测、图像风格迁移、句子分类等,
用户10686717
2023/08/01
3870
基于Pyramidbox实现的大规模人脸检测
今天来水一片文章,基于开源的Pyramidbox大规模人脸检测编写的PaddlePaddle教程,为了方便训练预测,本教程做了一定的修改。这个模型虽然大,但是符合大规模人群中也可以准确地检测到人脸,就是遮挡比较严重也能正确检测。
夜雨飘零
2020/07/09
6990
基于Pyramidbox实现的大规模人脸检测
OpenCV4 调用HED边缘检测算法
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 HED算法介绍 图像边缘检测是图像处理与计算机视觉领域最基础也是最重要的任务之一,早期的Canny边缘检测到现在还在使用,但是Canny边缘检测过于依赖人工阈值的设定,无法在通用场景下工作,如何找到一个在自然场景下可以正确工作的边缘检测器,答案是使用CNN。2015年的时候有人提出了基于卷积神经网络的边缘检测算法HED全称为《Holistically-Nested Edge Detection》, 先看一下HED与Ca
OpenCV学堂
2022/08/29
1.5K1
OpenCV4 调用HED边缘检测算法
相关推荐
OpenVINO实时人脸表面3D点云提取
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档