工矿自动化
张立亚,男,副研究员,博士研究生,煤炭科学技术研究院有限公司二级首席专家,智慧矿山研究所所长,工业互联网产业联盟5G+工业互联网特设组副主席,《工矿自动化》杂志青年专家委员会委员等。获得第三十一届孙越崎青年科技奖。从事矿山通信技术与智能矿山技术的研究工作,包括矿井5G通信、融合通信、智能视频分析、煤矿安全监控、应急救援等领域。主持或参与科研项目20余项,获得省部级科技奖项11项,发表核心期刊论文30篇。
一
研究背景
矿井人员精确定位技术是煤矿智能化关键技术之一。行人重识别技术作为人员身份位置信息确认的重要手段,对人员安全监管有重要意义。传统基于度量学习的煤矿井下行人重识别方法中,由于度量学习忽略正负样本绝对距离,造成损失函数梯度消失或梯度弥散,导致井下人员位置信息识别精度不高。针对上述问题,提出了一种基于改进度量学习的煤矿井下行人重识别方法。
二
研究方法
对图像进行预处理,提取图像特征点,并对这些特征点进行描述,得到一个特征向量,用于图像识别和分类。然后采用欧氏距离计算方法对特征向量进行相似性计算,将不同摄像机下行人图像中具有相似特征的人判定为同一人,最终实现人员相似性判断。
提出一种自适应的三重损失函数,在计算样本之间距离的过程中引入自适应变量,使用自适应的权重对损失函数进行动态调整,保证正负样本间距在合理范围内,使得模型更加关注难分类的样本和重要的样本,提高模型性能和训练效率,降低梯度消失或梯度弥散问题的影响。
三
实验结果
1)选取基于传统度量学习的井下行人重识别方法与基于改进度量学习的井下行人重识别方法进行性能测试,得到累积匹配特征曲线(图1)。基于传统度量学习的井下行人重识别方法在图像数位于两端(小于10或大于50)时,识别效率不高,在相似样本个数达到上限60时,样本匹配概率仅为 83%左右。基于改进度量学习的井下行人重识别方法在相似样本个数为50左右时,样本匹配概率达100%,识别准确率较改进前提升明显。
图1 行人重识别效率
2)使用基于传统度量学习的井下行人重识别方法和基于改进度量学习的井下行人重识别方法同时对分辨率为 224×224与640×640的图像进行识别,对比2种方法的推理耗时,结果见表1。基于改进度量学习的井下行人重识别方法对224×224与640×640图像的推理耗时较传统方法分别减少了44,68 ms。
表 1 行人重识别推理耗时对比
3)受井下低照度、高尘雾等环境影响及佩戴装备限制,采集图像中人员头脚部分精度往往较差且相似性普遍较高。基于改进度量学习的行人重识别方法可对图像中头脚部分进行剥离,减小模型在训练及识别过程中由于头脚相似性过高造成的噪声,并对图像进行三重分割,得到累积匹配特征(图2)。基于改进度量学习的井下行人重识别方法在舍弃行人头脚部分图像后表现更好,当相似样本个数为42左右时,样本匹配概率达 100%,识别准确率进一步提高。
图2 自适应的三重损失下重识别效率
引用格式
张立亚,王寓,郝博南. 基于改进度量学习的煤矿井下行人重识别方法研究[J]. 工矿自动化,2023,49(9):84-89,166.
ZHANG Liya, WANG Yu, HAO Bonan. Research on personnel re-recognition method in coal mine underground based on improved metric learning[J]. Journal of Mine Automation,2023,49(9):84-89,166.
行业推广
群组都一样,限加1个群哦!
领取专属 10元无门槛券
私享最新 技术干货