〈无损检测〉
基于卷积神经网络的超声红外热图像分类
林丽1,刘新1,朱俊臻2,冯辅周2
(1. 大连交通大学机车车辆工程学院,辽宁大连 116000;2. 陆军装甲兵学院车辆工程系,北京 100072)
摘要:在超声红外热像技术应用中,从红外热图像来判断被测对象是否含有裂纹,通常需要先基于人工经验,从红外热图像中提取特征再采用某种模式识别方法进行分类,裂纹的识别与定位过程繁琐且识别率较低。为此,提出一种基于卷积神经网络技术的超声红外热图像裂纹检测与识别方法,其特点是可以直接从超声红外图像中学习特征进而实现是否含有裂纹红外热图像的分类。通过实验得到的含裂纹和不含裂纹金属平板试件的红外热图像,建立卷积神经网络模型对图像中是否含有裂纹进行分类,研究结果表明,参数优化后的卷积神经网络模型对超声红外热图像的有无裂纹分类准确率达到
98.7%。
关键词:卷积神经网络;超声红外检测;图像识别;图像分类
中图分类号:TP391 文献标识码:A 文章编号:1001-8891(2021)05-0496-06
Classification of Ultrasonic Infrared Thermal Images
Using a Convolutional Neural Network
LIN Li1,LIU Xin1,ZHU Junzhen2,FENG Fuzhou2
(1. Dalian Jiaotong University, College of Locomotive and Rolling Stock Engineering, Dalian 116000, China;
2. Academy of Army Armoured Forces, Vehicle Engineering Department, Beijing 100072, China)
侧坐莓苔草映身Abstract: In the application of ultrasonic infrared thermographic technology, it is usually necessary to extract features from infrared thermographic images bad on artificial experience and then adopt a pattern recognition method to classify the cracks. The identification and positioning process of the cracks is complicated, and the recognition rate is low. Therefore, a method of crack detection and recognition in ultrasonic infrared thermal images bad on convolutional neural network technology is propod in this paper. Its feature is that the features can be directly learned from the ultrasonic infrared image to realize the classification of infrared thermal images containing cracks. Thesis through the rearch experiment of metal plate specimen of the crack in and do not contain infrared t
hermal images, the convolutional neural network model is established for whether the image contains crack classification, the results show that the parameter optimized convolution neural network model for ultrasonic infrared thermal images of crack classification accuracy rate reached 98.7%.
Key words: convolutional neural network; ultrasonic infrared detection; image recognition; image classification
0 引言
科技快速发展,计算机性能得到大幅提升,深度学习作为一种实现人工智能的强大技术,在图像视频、语音处理等领域获得了大量成果,对各个领域都产生了广泛的影响。卷积神经网络(Convolutional Neural Network,CNN)作为深度学习中极为重要的模型,自2012年以来极大地推进了图像分类、识别和理解技术的发展。曾平平等人[1]将卷积神经网络应用到水果图像分类中并取得了较好的识别率。林明旺
等人[2]将卷积神经网络应用于鱼类图像识别分类,识别率达到了96.24%。张安安等人[3]将卷积神经网络应用于轴承故障模式的识别中,该方法较其他方法分类准确率提高了4.26%。当然,卷积神经网络的影响不仅仅局限于图像处理,通过与其他技术的结合,卷积神经网络也在用于围棋程序AlphaGo、语音识别和机器翻译软件等各种应用系统,推动了人工智能的空前发展[4]。
本文依据卷积神经网络的特性提出了一种利用卷积神经网络对超声红外热图像分类的技术从而实现对裂纹的检测与分类,本方法将超声红外检测所得的图像输入到卷积神经网络中进行学习对其识别分类,并对多种网络的识别率进行对比,以确定最优方案。
1 卷积神经网络
卷积神经网络的基础结构为5部分,分别为输入层(Input Layer)、交替分布的卷积层(Convolution Layer)和池化层(Pooling Layer)、全连接层(Fully Connected Layer,FC)和输出层(Output Layer)[5]。
1.1 卷积层
输入的图像为矩阵形式,卷积层对应的卷积运算是此矩阵与参数矩阵在卷积层中做卷积操作的过程。参数矩阵也被称作卷积核,不同的卷积核能够提取到图像中的不同特征。卷积核的每个元素与被卷积
图像对应位置相乘,再求和。通过卷积核的不断移动,就会产生新的图像,该图像完全由卷积核在各个位置时的乘积求和的结果组成。卷积网络中的卷积核参数是通过反向传播中不断优化训练出来的,卷积核除了可以学习到类似于横向边缘、纵向边缘,还可以学习到任意角度边缘甚至检测颜色、纹理等信息[5]。
1.2 池化层
池化层主要的作用是下采样,通过去掉特征图(feature map)中不重要的样本,进一步减少参数数量。池化的方法很多,常用的是最大池化(max pooling)与平均池化(mean pooling)。最大池化实际上就是在n×n的样本中取最大值,作为采样后的样本值。平均池化就是取其平均值作为采样后的样本值。池化层可降低数据维度,避免过拟合、增强局部感受野以及提高平移不变性。
1.3 全连接层
全连接层的作用是搭建特征提取到分类的桥梁。全连接层将学习到的特征空间里的特征参数映射到样本的标记空间里。特征向量的长度对应分类的类别数。由于此特征向量里的值是将经过多个卷积层、池化层以及激活函数所获得的图像特征进行高度提纯后得到的,所以这个特征向量具有高层的特征信息,即包含了输入图像经过各种操作的所有特征的组合信息,这些信息就是图像中最具有特点的特征,这样就可以通过这些信息输出图像具体所属类别的概率值对图像进行分类。
2 基于卷积神经网络的超声红外热图像分类
实验
2.1 超声红外热像技术原理与图像采集
2.1.1 红外热成像无损检测技术的原理
超声红外热像技术采用超声脉冲作为激励源,注入被测对象的振动能量传播至裂纹、分层等接触界面类型缺陷区域时,缺陷区域因摩擦生热、塑性变形等产生热量,使机械能转化为热能,产生的热量以热波的形式向试件表面传导,从而通过热像仪获取表面温度分布来判断被测对象内部或表面缺陷[6]。
超声红外热像技术发挥了超声和红外热像技术的优点。利用超声在传播路径上因缺陷等不均匀结构引起超声的附加衰减,使缺陷局部温度升高,同时利用红外照相机以较大的视场显示被检测物体的表面温度分布,而不必考虑超声源与缺陷之间的相对方位和距离。由此,采用红外热像技术进行缺陷检测的特点是不受材料的几何结构及材质的限制,可以实现非接触、大面积的检测,具有可靠性强、灵敏度高、检测速度快和使用方便等优点[7]。
2.1.2 系统组成
课题组自主设计搭建了一套超声红外热像无损检测实验台并编写一套超声红外无损检测系统软件,实现软件及硬件上的实验要求,并实现激励与图像信号采集的同步控制。实验台主要由超声激励装置、图像采集装置及导轨等辅助装置组成,如图1所示。
图1 超声红外热像无损检测实验台
Fig.1 Ultrasonic infrared thermal image nondestructive testing bench
图像采集装置采用美国FLIR公司生产的
T640
497
498
型红外热像仪,主要用于实现采集对象表面的温度场信息。其采用非制冷微热量红外焦平面阵列,实现了整幅图像所有像素点同时采集,有效避免了光机扫描式红外热像仪存在的同一幅图像不同像素点采集时间有偏差的不足。该热像仪可以提供T 系列红外热像仪中最高的红外图像分辨率,为640 pixel ×480 pixel,热灵敏度优于0.035℃,图像采集帧频为30 Hz ,镜头可实现120 上下翻转。其自带软件FLIR-Rearch IR 功能强大,可在同一场景下序列图像中选定多个不同形状区域,并绘制选定区域的平均温度值、最高温度值等相关温度信息随时间的变化曲线,并实现简单的图像处理功能。
2.2 实验数据采集及获取
本次实验数据采集的对象为金属平板试件,分为有裂纹与无裂纹。在课题组搭建的试验台上进行金属板的激励采集实验。控制采集终端采用课题组自主开发的系统,可实现对红外热像仪及超声换能器在自动、手动两种情况下的同步控制,并可视实验需求对超声激励振幅、频率、作用时间进行快速调节,在最短时间内完成对待测件的有效检测。
薛万彻实验共进行6组,每组实验对应着不同的激励参数或不同的激励位置。激励结束后实验采集系统会自动生成对应文件,然后通过FLIR-Rearch IR 软件生成CSV 文件。
此次选取的实验数据为同侧激励,获得的图像共有两千多张,图2给出了一张含裂纹缺陷的红外热图像,图中温度较高的红色圆点周围区域对应着实际裂纹所在位置。
将实验所得的CSV 文件输入到软件MATLAB 中进行图像处理,选取所需的实验范围,制作实验所需的数据集。最终实验图像数据共2024张,含有裂纹
和无裂纹各1012张,并将图像像素尺寸大小先后设置为16×16、32×32、64×64、128×128。并分别进行卷积神经网络的建模与测试。 2.3 卷积神经网络模型建立 2.3.1 AlexNet 网络模型
本文采用深度学习框架Deep Network Designer 构建卷积神经网络。Deep Network Designer 是一个基于MATLAB 的神经网络设计平台,与MATLAB 软
件有着良好的兼容性。整个AlexNet [8]
有8个需要训练的层,不包含局部响应归一化(Local Respon Normalization ,LRN )层和池化层,前5层是卷积层,后3层全连接层。此处用软最大函数(Softmax )层替代最后一层全连接层,新的网络模型依旧有8层,其中包含了5个卷积层(C1、C2、C3、C4、C5),2层全连接(F1、F2)和1个分类层。使用重叠最大池化方法,池化核尺寸大于步长,使卷积层的输出之间有重叠部分,提升了特征的丰富性。使用校正线性单元(Rectified Linear Unit ,ReLU )作为激活函数,并将其应用于
每个卷积层及全连接层的输出之后,解决网络较深时的梯度弥散问题。在6、7两个全连接层后使用丢失(Dropout )算法,随机让网络的某些节点失去作用,减小过拟合,网络结构如图3所示,网络模型及参数如表1所示。
2.3.2 迭代次数的确定
迭代的过程是不断拟合不断逼近,迭代次数(epoch )过少会影响拟合效果。当迭代次数到达一定数量时,拟合误差接近收敛,不再减小,过高的迭代次数会不断的增加实验的时间成本。所以选择适当的迭代次数能在得到最佳拟合效果的同时拥有最小的时间成本。
The crack area
图2 实验获得的超声红外图像 图3 AlexNet 网络结构
Fig.2 Ultrasonic infrared image obtained by experiment Fig.3 AlexNet network structure
表1 网络模型参数总量
Table 1 Total parameters of network model
Layer’s name Explanation Number of parameters Input Input - Cov1 96 convolution kernels(11×11×3)11×11×3×96+96=34944
Cov2 256 convolution kernels(5×5×48)(5×5×48×128+128)×2=307456
Cov3 384 convolution kernels(3×3×256)3×3×256×384+384=885120
绪字组词
Cov4 384 convolution kernels(3×3×192)(3×3×192×192+192)×2=663936
Cov5 256 convolution kernels(3×3×192)(3×3×192×128+128)×2=442624
Fc1 Full connection layer 1 (6×6×128×2)×4096+4096=37752832
Fc2 Full connection layer 2 4096×4096+4096=16781312
Output Softmax
classification output 4096×1000+1000=4097000
Summation - 60965224
为测试最佳的迭代次数,简化讨论的复杂度,将迭代次数以外的其他参数设为固定值,应用上述CNN 网络模型,设定最大迭代次数为30次,通过网络的训练选取最佳的迭代次数。
2.3.3 网络模型性能参数优化
对AlexNet模型中可调参数进行优化,此处优化的参数有两个,分别是网络训练时批量尺寸(batchsize)以及在防止过拟合中使用的丢失比率。
批量尺寸即每次训练在训练集中取定量样本训练,迭代过程以iteration作为单位,1个iteration等于使用批量尺寸个样本训练一次,而迭代次数等于使用训练集中的全部样本训练的次数。批量尺寸在卷积神经网络的训练中,影响着网络的训练速度和网络最终的训练效果,当批量尺寸选择较大的时候,网络训练收敛速度比较快,但同时由于权值调整次数减少会影响训练效果,批量尺寸选择较小时则反之,所以,需要在较小的时间成本内取得较好的网络训练效果,那么就需要根据时间成本和训练效果的平衡来选择合适的批量尺寸。
批量尺寸一般需要满足可以整除全部样本数据个数,但实际训练中如果不能整除,网络会自动舍弃最后的余数部分数据,在样本量较大的情况下不会影响整体的训练效果。AlexNet模型中批量尺寸一般为16的倍数,所以实验中选择批量尺寸大小依次为16,32,64,128;参数在MATLAB深度学习程序training Options下进行调整;重复实验10次,取10次实验最终分类正确率的平均值和训练所用时间的平均值为标准,则二者随批量尺寸的变化关系如表2所示。
由表2可以看出,批量尺寸选择的越大,网络训练时间就会越长;除了批量尺寸取16时的识别正确率较低,其余情况下识别率基本在97%左右,因为在批量尺寸选择的过小的时候,网络收敛不稳定,loss 函数收敛动荡,导致在批量尺寸最小时有着最低的识别率。所以实际应用中,在保证时间成本的情况下,选择恰当的批量尺寸可以提高网络的识别正确率,有助于故障类别的判断。针对此次实验可以将批量尺寸选择为32或者64。
表2 不同批量尺寸下的识别正确率和网络训练时间Table 2 Recognition accuracy and network training time under different batch sizes
Batch size 16 32 64 128 Accuracy/% 56.69 97.34 97.64 97.11 Time 7min43s 8min10s 9min15s 9min18s
2012年,Alex、Hinton提出了AlexNet模型的同时,用到了丢失算法,用于防止过拟合[8]。丢失算法
的工作原理是在每次网络训练中,通过忽略一定比例的特征检测器,可以减少过拟合现象的发生。而丢失比率代表着忽略特征检测器的比例,不同比例的忽略可以对过拟合现象有着不同的影响。参数与批量尺寸大小一样可以在MATLAB深度学习程序training options下进行调整。丢失比率从无到有一般可以选择10种比率,分别为0到0.9,间隔为0.1。针对10种比率,重复10次实验,取10次实验最终分类正确率的平均值为标准,识别正确率随丢失比率变化的关系如表3、表4所示。
对批量尺寸32与64两者分别进行dropout比率的选取实验,通过实验,最终确定参数的选择为批量尺寸选取64、dropout选取0.5、迭代次数为20次。2.3.4 模型实验
实验平台为WIN10系统,仿真软件为MATLAB2019b,GPU为GeForce GTX 1060 3G。将不同大小尺寸的图像输入到网络中进行训练识别,输入到网络中的图像70%作为训练集,其余各15%为测试集和验证集。进行10次实验取其均值,获得的识
499
50别如分示百
2.G G 00
别率如表5所如图4所示,分类结果图5示实际情况,百分比分别代A A 由此可知到98.7%且时.3.5 模型
对为了验证GoogLeNet [9]GoogLeNet
所示,其中某此次测试样中的矩阵称纵轴表示预代表所有测试Dropout Accuracy/%
Dropout Accuracy/%
Fig.4The size of th Accuracy Time
哗众取宠的意思知图像尺寸为间相对较少对比
证此网络模型和ResNet [10]和ResNet
网络次训练的正确样本的分类结称为混淆矩阵预测情况。最右试样本分类的Table 3 0 0.1 95.6 97.4 Table 4 0 0.1 96.6 98.1 图4 训练结4 Training res he image
y/% 为64×64时识。 型的分类识别]
两种CNN 模
络模型分别是确率和损失曲果如图5所示,其中,横轴右下角方框中的正确率和错表3 批量尺寸Different dropo 0.2 0.3 97.6 97.5表4 批量尺寸Different dropo 0.2 0.3 98.3 97.1果曲线 sult curves 表5 Table 5 Imag
16×16 98.38 11 min12 s
识别率最高,的能力,将其模型进行对比是2014年和
2曲线示。
轴表
中的错误率,分别此模数量加数32时不同丢失out rate recogni 0.4
5 96.9 64时不同丢失out rate recogni 0.4
97.3
不同尺寸图像ge recognition r 32×32 98.36 8 min2 s
,达其与
比,2015年世和5相同设置Ale
批量最后一行方别代表每种图模型训练及分量大小有一定数据集进行实失比率下的识别ition rates at ba 0.5 0.6 98.4 97.3失比率下的识别ition rates at ba 0.5 0.6 98.7 97.1
Fig.5 像识别率
rates of differen 6s 9 m 世界ImageN 50层(卷积层
清非的文同的输入,即置为相同,批exNet 模型均
量尺寸设置为O u t p u t C l a s s
方框(除去最图像测试样本分类结果并未定的关联,在实验,获得的别率 atch size 32
0.7
3 98.2 别率 atch size 64
0.7
1 98.1 图5 测试Classification r nt sizes 64×64 98.70
爱的旅途min18
s
et 比赛的冠军层加全连接层即相同的图像批量尺寸设置均可设置为64为64会出现w
世界最大盆地
u
最右下角方框本分类的正确未达到100%
在实验条件允的识别率一定0.8 0.9
97.1 97.20.8 0.9
97.4 97.3试样本分类结果results of test sa 128×128 98.03 13 min29 s
军,网络深度层的数量)。使像样本集,网置时,Goog
4;ResNet 模现程序错误的y o
u
框中)的百分率和错误率[3%,与样本集允许的情况下定会有所提高2
果 amples
度分别为22使用与AlexN 网络训练参数gLeNet 模型模型训练时当
毛衣针法的现象,所以分比
3]
。
的增高。
层
Net 数也
和把本