基于二维图像矩阵的稀疏表示分类方法
程广涛;宋占杰;陈雪
【摘 要】利用稀疏表示对图像分类时,需要将二维图像转换为一维特征向量,这大大增加了计算复杂度和忽略了图像矩阵中固有的局部结构信息.为了解决上述问题,设计了完全基于二维特征矩阵的稀疏表示人脸分类方法.首先将二维图像转为2D Fisherface矩阵,然后直接利用二维矩阵求解稀疏表示和进行分类.整个识别过程中,不需要将二维图像转换为一维向量.实验结果表明,二维特征矩阵在稀疏表示分类中是十分有效的,设计的方法可以更快的运算速度达到更高的识别率.在ORL人脸数据库和Extended Yale B人脸数据库上的识别率分别达到97.5%和99.3%.
【期刊名称】《天津大学学报》
茶花盆景【年(卷),期】2014(047)006
【总页数】5页(P541-545)
【关键词】冬花的功效与作用人脸识别;稀疏表示;目标分类;二维特征矩阵
【作 者】程广涛;宋占杰;陈雪
【作者单位】天津大学电子信息工程学院,天津300072;北华航天工业学院基础部,廊坊065000;天津大学理学院,天津300072;北京中医药大学东方学院基础部,廊坊065000
【正文语种】中 文
【中图分类】TP391.41
信号的稀疏表示是分析信号的一个极其有效的工具.稀疏表示的成功应用包括图像恢复[1-2]、压缩感知[3-5]、图像超分辨率[6]等.最近,稀疏表示又成功应用在人脸识别领域[7].如果每类训练样本足够多,测试样本可以考虑为与它同类训练样本的线性组合,这样用所有训练样本表示测试样本时,表示系数中的非零系数只对应于与测试样本同类的训练样本,显然表示系数是稀疏的.这样就可以通过估计最小重建误差来决定测试样本的类别.稀疏性限制使表示系数的区分能力加强,改善了人脸识别的准确性和鲁棒性.
基于稀疏表示的分类方法(spar reprentation bad classification,SRC)一经提出,就得到了广泛的关注.沿着SRC的框架,提出了一种新的基于联合动态稀疏表示的多角度人
脸识别方法[8].这种方法把多角度人脸识别看作为联合稀疏表示模型,利用多角度的内相关性来解决姿势不限的自动人脸识别问题.文献[9]设立了一个基于稀疏表示的实际的人脸识别系统,它能够在大范围的光照条件、姿势变化和噪声干扰的条件下达到极其稳定的性能.另外,有效的字典学习方法也被应用到基于稀疏表示的模式识别中[10-12].
乱论文学但是这些算法首先都是将二维图像矩阵转换为一维图像向量,这就需要花费更多的时间去计算1ℓ最优化问题,并且也忽略了原有二维图像矩阵中的一些局部结构信息.因此,提出了一个基于二维图像像素矩阵的稀疏表示分类方法(2D SRC)[13].这种方法与SRC相比更加快速,尤其当图像分辨率很高时,速度优势更加明显,但是识别率的改进效果没有达到期望值.
三句半表演现有的SRC框架中,都是用一维特征向量进行稀疏表示,二维特征矩阵在SRC算法中的应用还鲜见报道.本文首先验证了二维特征矩阵在SRC框架中的有效性,然后设计了一个完全基于图像矩阵的稀疏表示分类方法,在整个方法中都没有将二维图像转换为一维向量.笔者在常见的ORL人脸数据库和Extended Yale B人脸数据库上进行实验并验证了该算法的有效性和优越性.实验结果表明,所设计算法可以更快的计算速度达到更高的识别率.
以下讨论二维特征矩阵(2D PCA[14],2D Fisherface[15])应用在SRC框架中产生的效果.
给定来自c类的N个训练图像组成的训练图像矩阵A=[A,A,…,A],A∈Rm×n(i=1,2,…,N),表示
12N i第i个训练图像.图像协方差矩阵可定义为
手机串号查询
式中为所有训练图像的均值图像.设g1,g2,…,gd为Gt的d个最大特征值对应的特征向量,特征转换矩阵G=[g,g,…,g]用来二维特征提取,P=AG∈Rm×d
12dii(i=1,2,…,N)表示第i个训练图像的2D PCA投影.利用所有图像的2DPCA投影构建2D PCA特征矩阵P=[P1,P2,…,PN].
P的类间散布矩阵Gb和类内散布矩阵Gw可定义为
式中:Mi为P中的第i类图像的均值矩阵;为P的均值矩阵.利用G的最大s个特征值对应的特b征向量b1,b2,…,bs构建投影矩阵B=[b1,b2,…,bs],第i个图像的2D Fisherface特征矩阵可表示为Fi= BTP=BTAG∈Rs×d,这样2D PCA矩阵P转换为2Di Fisherface矩阵F=[F1,F2,…,
FN].把Fi转换为列向量f∈Rl×1(l为2D Fisherface空间的特征维数,l=s×d,i i=1,2,…,N)这样所有训练图像的2D Fisherface向量特征构成矩阵R=[f1,f2,…,fN].
测试图像Y经2D Fisherface投影并且转换S为列向量y,然后通过ℓ1最优化计算y在字典R下的稀疏表示系数,即
最后通过估计最小重构误差完成分类,即
式中δ是一个新向量,它保留了稀疏表示系数xˆ中与第i类相对应的元素,令其他元素为零.
基于2D Fisherface的SRC算法可以有效地改进基于一维图像特征的SRC算法的性能.笔者从ORL人脸数据库中每类选择5个图像作为训练样本,另外5个图像作为测试样本.图1(a)的测试图像来自ORL人脸数据库的属于第19类的一张图像,图1(b)是利用基于一维Fisherface的SRC算法得到的稀疏表示系数和重构误差,图1(c)是利用基于2D Fisherface的SRC算法得到的稀疏表示系数和重构误差.可见,二维特征矩阵在SRC框架下更加有效,它能够对基于一维特征的SRC造成的错误分类进行校正.
此外,原来的SRC的计算复杂度为O(LN)(L= m×n),而基于2D Fisherface 的SRC的计算复
杂度为O(lN),l≪L(L为图像像素),因此基于2D Fisherface 特征的SRC算法将会很大程度地提高人脸识别速度.
笔者设计了一个完全基于二维图像矩阵的稀疏表示分类方法(2D SRC-2D Fisherface).2D Fisherface的有效性已经被验证,所以首先将图像通过2D Fisherface转换为二维特征矩阵,然后不将2D Fisherface矩阵转换为列向量,而是直接在2D Fisherface矩阵F下求解测试样本的稀疏表示系数
将式(6)展开,有
因为矩阵Q是对称半正定矩阵,Q的SVD分解为
排卵期性欲>辣白菜定义W=(UΛ1/2)T,z=Λ†Wb,保留W中对应r个较大奇异值的列,这样矩阵W的大小为r×N,其中r<min(l,N).式(7)能够转换为等价的一维压缩感知问题,即
通过上述处理,能够进一步减少1ℓ最优化问题的计算复杂度.表1给出了上述方法中1ℓ最优化问题的计算复杂度,其中rlL<≪.
最后的分类能够通过估计式(9)的最小重构误差而完成.
基于2D SRC[13]方法和基于2D SRC-2D Fisherface的人脸识别效果如图1(d)和图1(e)所示,可以明显地看到2D SRC-2D Fisherface方法除了具有速度优势外,还可以很好地改善识别率.
笔者利用常见的ORL人脸数据库和ExtendedYale B人脸数据库[16]来验证设计算法的性能.在3.20,GHz CPU和2,GB内存的PC上利用Matlab软件完成所有实验.SRC框架中ℓ1最优化的计算比较耗时,一些快速算法可加速ℓ1最优化的求解,如文献[17]所述,采用Homotopy方法可以达到最高的识别率,并且其计算成本与其他快速ℓ1最优化求解方法相差无几.所以,本实验所有的ℓ1最优化问题都采用Homotopy方法求解.
3.1 ORL人脸数据库
ORL数据库包含40个人的400张人脸图像,这些图像中包含不同的脸部表情、人脸细节及其旋转和尺度变化.所有图像的分辨率归一化为112×92.比较基于一维特征向量(PCA,Fisheface,Random projection)的SRC[7]、基于2D Fisherface的SRC、2D SRC[13]和基于2D Fisherface的2D SRC的人脸识别性能.
从每类图像中选择5张图像作为训练样本,另外5张图像作为测试样本.对于SRC框架,首先将图像转换为维数分别20、42、72和168的一维特征向量.由于测试样本有40类,对于Fisherface,特征维数最多为39,因此只能计算当维数为20的识别率.同时,为了和一维特征进行比较,2D Fisherface的维数选择为5×4、7×6、9×8和14×12.对于2D SRC框架,估计基于图像像素的2D SRC方法[13]和基于维数分别为5×4、7×6、9×8和14×12的2D Fisherface的2D SRC方法的性能.各种方法的识别率比较见表2.
杨红樱女生日记由表2可见,2D Fisherface在SRC框架中非常有效,基于2D Fisherface的方法达到了最高的识别率.
在上述所有算法中,都需要求解1ℓ最优化问题,因此有必要估计各种算法中1ℓ最优化问题的计算性能.各种算法达到最高识别率时求解1ℓ最优化所需的计算时间结果如表3所示.
从表3可见,虽然基于2D Fisherface的SRC和基于2D Fisherface的2D SRC识别率都达到了97.5%,但是2D SRC-2D Fisherface的计算速度要比SRC-2D Fisherface的计算速度快2~3倍.
3.2 Extended Yale B人脸数据库
Extended Yale B人脸数据库包括来自38个人的2,414张人脸图像.图像的分辨率归一化为192168×.笔者从每类中选择1/2图像作为训练样本(每类约32张图像),另外1/2作为测试样本.与在ORL数据库上的实验相似,比较基于一维特征向量(PCA,Fisheface,Random projection)的SRC、基于2D Fisherface的SRC、2D SRC和基于2D Fisherface的2D SRC的人脸识别性能.
对于SRC框架,将图像转换为维数分别30、56、120和504的一维特征向量.由于测试样本有38类,对于Fisherface,只计算当维数为30时的识别率.同时,估计维数分别为65×、87×、1210×和2421×的基于2D Fisherface的SRC方法的性能.对于2D SRC框架,估计基于图像像素的2D SRC方法[13]和基于维数分别为65×、87×、1210×和2421×的2D Fisherface的2D SRC方法的性能.表4给出了各种方法的识别率.
各种方法达到最高识别率时的1ℓ最优化问题的计算时间见表5.
实验结果再次显示了2D Fisherface的有效性,基于2D Fisherface的分类方法达到了99.3%的识别率.同时,实验结果也显示2D SRC-2D Fisherface的计算速度比SRC-2D Fisherface的计算速度快约10倍,说明基于二维图像矩阵的稀疏表示分类方法对于较大的
数据库有更明显的速度优势.