深度学习已经显示出了强大的分类能力,因此可以在钢铁材料的显微组织分类上发挥更大的作用。在计算机视觉识别问题方面,人工神经网络方法如卷积神经网络(CNNs)已经显示出强大的威力。与CNNs将特征提取与特征识别分开进行不同,深度学习是将特征提取与特征识别融合在一起进行的。德国马普所的研究人员采用全卷积神经网络(FCNNs)进行钢铁材料微观组织的分类,研究认为在像素级别的识别上显著提高了识别效率,识别正确率达到93.94%。研究结果发表在2018年2月1日的《自然》上。
研究人员对比了传统的卷积神经网络技术(CNNs)和全卷积神经网络技术(FCNNs)。对于CNNs,需要将光学显微镜获得图像裁剪和扭曲为224×224像素的输入图像。采取FCNNs技术可以避免在裁剪和扭曲过程中的信息损失。由于GPU内存的限制,FCNNs使用时需要用窗口将原始图像裁剪为多个片段作为输入。CNNs结构包括三种类型:CIFAR-Net、VGG-16以及VGG-19。CIRAR-Net包含有3个卷积层、1个最大池化层和2个全连接层。VGG-16包含有13个卷积层、5个池化层和3个全连接层。而VGG-19包含有19层。FCNNs是在VGG-16基础上取消了全连接层,将全连接层改成卷积层和取样层,并且引入跳跃层用来平滑边部细节。
在该项研究中,研究人员使用了Caffe框架,GPU型号为NVIDIA K40m。所有显微组织照片来自于德国萨尔州材料工程中心,所包括的显微组织包括马氏体、回火马氏体、贝氏体和珠光体。这里所说的显微组织是指在基体组织中析出的第二相。
结果表明,使用CNNs的分辨准确率远远低于使用FCNNs,前者最高为66.50%,后者达到93.94%。同时还发现,使用扫描电镜照片比使用金相显微镜照片更有利于获得准确的分辨。混淆矩阵表明,对马氏体的分类准确率为94.97%,对贝氏体的分类准确率为94.20%,对回火马氏体的分类准确率为97.81%,对珠光体的分类准确率为95.19%。所有分类错误的贝氏体组织都属于变形贝氏体,这些组织没有被包含在训练集合中。
领取专属 10元无门槛券
私享最新 技术干货