基于BP神经网络的主分量分析人脸识别算法概要.docx
- 文档编号:17048025
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:25
- 大小:27.74KB
基于BP神经网络的主分量分析人脸识别算法概要.docx
《基于BP神经网络的主分量分析人脸识别算法概要.docx》由会员分享,可在线阅读,更多相关《基于BP神经网络的主分量分析人脸识别算法概要.docx(25页珍藏版)》请在冰点文库上搜索。
基于BP神经网络的主分量分析人脸识别算法概要
ComputerEngineeringandApplications计算机工程与应用2007,43(36
人脸识别技术就是利用计算机技术对人脸图像进行分析,从中提取有效的特征来识别出人的身份,其关键技术在于人脸特征的描述和模式识别。
目前,根据人脸表征方式的不同,分为三大类:
基于几何特征的识别方法、基于代数特征的识别方法和基于神经网络的识别方法。
基于几何特征的识别法是提取人脸的几何特征,根据特征点的性质进行识别,Poggio和Brunelli[1]用改进的积分投影法提取出欧氏距离表征的35维人脸特征矢量用于模式分类,但是该方法没有形成一个统一、优秀的特征提取标准。
基于代数特征的识别法是提取人脸的代数特征,运用代数运算进行分析然后识别。
Turk和Pentland[2]提出了“特征脸”方法,该方法根据一组投影系数,和各个已知的人脸图像比较识别,由于代数特征矢量(即人脸图像向特征脸空间的投影具有一定的稳定性,识别系统对不同的表情有一定的鲁棒性。
但是,这也说明了这种方法对表情的描述不够充分,难以用于表情分析。
神经网络识别法则是通过神经网络的训练学习,得到相应的识别函数关系,从而进行识别。
Kohonen[3]率先运用自相关记忆(全互联神经网络存储和重建人脸图像,表明了自相关神经元具有识别能力。
神经网络在结构上更类似于人脑,在编码压缩与信息处理方式等方面具有一定的优势。
但由于原始灰度图像数据量十分庞大,训练时间通常很长。
本文提出了基于主分量分析(PCA与BP神经网络的人脸识别算法,该算法利用小波变换(WaveletTransform的多分辨率分析对原始灰度图像数据进行数据压缩、去噪声,得到低频小波子图,克服了PCA数据庞大带来的不便,再根据BP神经网络较强的学习、归纳分类能力,得到人脸主分量与所属人类别的函数映射关系,从而实现人脸识别。
本方法是一种快速、实用、有效的人脸识别方法。
1基于PCA的人脸特征的描述和提取
1.1图像的数学描述
人脸都含自己的内在特征,人脸识别的关键在于寻找这些内在特征。
将一幅人脸图像表示成一个m维列向量,其中m=图像的像素数=width×height=w×h,即将第i个样本的灰度图像表示成向量x=[x
1
x2,…,xm]的形式。
设有M个人,每个人有n幅图像,
基于BP神经网络的主分量分析人脸识别算法
赵立强1,张晓华1,2,高振波3,张洪亮1
ZHAOLi-qiang1,ZHANGXiao-hua1,2,GAOZhen-bo3,ZHANGHong-liang1
1.河北科技师范学院数理系,河北秦皇岛066004
2.哈尔滨理工大学计算机科学与技术学院,哈尔滨150080
3.河北科技师范学院计算机系,河北秦皇岛066004
1.DepartmentofMathematicsandPhysics,HebeiNormalUniversityofScienceandTechnology,Qinhuangdao,Hebei066004,China
2.CollegeofComputerScienceandTechnology,HarbinUniversityofScienceandTechnology,Harbin150080,China
3.DepartmentofComputer,HebeiNormalUniversityofScienceandTechnology,Qinhuangdao,Hebei066004,China
E-mail:
zhao_liqiang@
ZHAOLi-qiang,ZHANGXiao-hua,GAOZhen-bo,etal.FacerecognitionbasedonBPnuralnetworksandprinciplecom-ponentanalysis.ComputerEngineeringandApplications,2007,43(36:
226-229.
Abstract:
BPneuralnetworkcombinedwithprincipalcomponentanalysisisappliedtohumanfacerecognition.Afterextractinglowfrequencysub-bandoffaceimageinwavelettransform,theeigenfacespaceisconstructedbyPCA.Thenallsamplesarepro-jectedintothesubspace,thecoefficientofeverysampleisinputtedtoBPneuralnetwork,andthefacerecognizerconsistsofBPneuralnetworkandpost-probabilityconverter.TheexperimentsonORLfacedatabaseindicatetherecognitionratioisgreatlyim-proved.
Keywords:
facerecognition;BPneuralnetwork;principlecomponentanalysis(PCA;wavelettransform
摘要:
提出了基于BP神经网络的主分量人脸识别算法。
该算法首先用小波变换对人脸图像进行小波分解,形成低频小波子图,然后用主分量分析法构造特征脸子空间,将人脸图像在特征空间的投影作为BP神经网络的输入,由BP神经网络和后验概率转换器构成人脸识别器。
针对ORL人脸库的实验结果表明该方法具有较高的识别率。
关键词:
人脸识别;BP神经网络;主分量分析(PCA;小波变换
文章编号:
1002-8331(200736-0226-04文献标识码:
A中图分类号:
TP391.41
作者简介:
赵立强(1967-,男,副教授,博士,主要研究方向:
机器视觉;张晓华(1979-,女,助教,硕士,主要研究方向:
图像处理与模式识别;高振波(1967-,男,实验师,主要研究方向:
计算机信息处理;张洪亮(1984-,女,硕士,主要研究方向:
图像处理。
226
2007,43(36
即有N=M×n个样本。
1.2小波变换人脸图像去噪声、数据压缩
小波变换(WaveletTransform相当于滤波器的作用,每次
把图像分解为长度减半的一个低频分量和一个高频分量,而总
的数据量未变,其中低频分量为平滑部分,高频分量为细节部
分。
利用小波函数将图像信号通过多分辨率分析推广到二维情
况[4]。
将二维数字信号(即数字图像X
w×h
看作s!
f(h,w,即
s!
f(h,w=
R2
""f(x,y!
(x-h,y-wdxdy
其中!
(x,y为二维尺度函数:
!
(x,y=!
(x!
(y,!
(x、!
(y
是多分辨率空间{Vj2}
j∈Z
的一维尺度函数。
对人脸图像小波分解
的物理意义如图所示,图1(a表示原始的人脸图像,图1(b表示对一幅人脸图像进行1级小波变换分解得到的结果,图1(c表示对一幅人脸图像进行2级小波变换分解得到的结果。
从图中可见,虽然对数据进行了压缩,图像依然清晰度很高,即虽然图像的信息容量有所减小,但小波域的能量并未减小很多,图像的信息量仍然很大,可以进行下一步的特征提取。
1.3人脸图像的主分量提取
主分量是统计学中分析数据的一种有效的方法,其目的是在数据空间中找一组向量以尽可能地解释数据的方差,将数据从原来的N维空间降维投影到M维空间(N>>M,在降维后保存了数据中的主要信息,从而使数据更易于处理。
一幅N×M大小的人脸图像可以按列相连而构成一个NM维的列向量,该向量可看成是NM维空间中的一个点。
由于人脸结构的相似性,人脸图像在这一高维空间中不是随机或散乱地分布的,而是存在着一定的规律性。
因此可以通过K-L变换用一个低维子空间描述人脸图像,同时又可以保留所需要的识别信息。
1.3.1人脸特征子空间的构造
读入小波变换之后得到的人脸低频特征,将第i幅人脸图像看作一个一维向量,记为x
i
则该向量的协方差矩阵可以表示为:
C=1N
N
i=1
$(xi-x%(xi-x%T=1NDDT
其中,x%=
1N
i=1
$xi为训练样本集的均值向量,N为训练样本的总
个数,D=x
i
-x%。
由于C为对称矩阵,可以将其对角化
C=U!
UT=
R
i=1
$"iuiuTi
其中"i为C的特征值,u
i
为相应的特征向量,{u
1
u2,…,uR}为标
准正交基,R为协方差矩阵C的秩,!
为对角阵,对角线上的元素为C的各特征值。
通常协方差矩阵C的维数较大,如果直接计算它的特征值和正交归一化特征向量,计算量很大。
而对于任意实矩阵Am×n,都可以利用奇异值分解将其转换为对角阵。
因此可以采用奇异
值分解来进一步降维。
引理1(SVD[5]令A
m×n
是实矩阵(不失一般性,假设m≥n,且rank(A=k,则存在两个正交矩阵Um×m和Vn×n以及对角
阵D
m×n
使得下式成立
A=UDVT(1其中:
Dm×n=
k×k
$0
’
(
(
(
(
(
((
*
+
+
+
+
+
++
k×k
$=diag(#1,#2,…,#k
Um×m=(u1,u2,…,uk,uk+1,…,um
Vn×n=(v1,v2,…,vk,vk+1,…,vn
式中#
i
=i
-i=1,2,…,k,…,n称为矩阵A的奇异值,"1≥"2≥,…,≥"k>0是AAT并且也是ATA的非零特征值的全体,
而"
k+1
="k+2=,…,="n=0为ATA的n-k个零特征值。
ui、vi(i=1,2,…,k分别是AAT和ATA对应于非零特征值"i的特征向量。
ui(i=k+1,…,m是为了表达上的方便而引入的(m-k个向量,
可以设想它是AAT对应于"
i
=0的特征向量。
同理,vi(i=k+1,…,n为ATA对应于"i=0的特征向量。
将式(1写成乘积的形式:
A=
K
i=1
$#iuivTi(2
设U
k
={u1,u2,…,uk},Vk={v1,v2,…,vk},则式(2可以表示为A=Uk
k×k
$Vk
从而可得U
k
=AVk
k×k
$-1,为AAT非零特征值"i对应的特征向量构成的矩阵。
由上述的引理容易求出协方差矩阵C的正交归一化特征向量为:
ui=1
i
-
xvi,i=1,2,…,N
如果矩阵A代表一幅人脸图像,式(2就是该人脸图像进
行了正交分解,对于任何实矩阵,在"
1
≥"2≥,…,≥"k>0的限制下,奇异值对角阵是唯一的,因此原人脸图像A对应的奇异值特征向量也是唯一的。
这些特征向量所代表的就是人脸的代数特征,称为“特征脸”。
若将第i幅人脸图像向量x
i
在特征向量u
i
上的投影记为
P
u
i
则有Pu
i
=uixi。
令P
u
={P
u1
P
u2
…,P
uR
}=UT-1xi,则P
u
的协方差矩阵为:
E[(Pu-P.u(Pu-P.uT]=UTE[(xi-x%i(xi-x%iT]U=UTCU=!
由此可见,x
i
在特征向量u
i
上的投影的方差就是ui
对应
的特征值"
i
并且各投影之间互不相关。
因此特征值越大,与之对应的特征向量对方差的贡献也就越大,为此依照公式
t=min
k
k
i=1
$ui
N
i=1
$ui
≥0.9,k≤
2
2
2
22
1
2
2
2
22
3
4
2
2
2
22
5
2
2
2
22
6
t
赵立强,张晓华,高振波,等:
基于BP
神经网络的主分量分析人脸识别算法227
ComputerEngineeringandApplications计算机工程与应用
2007,43(36ABCDEFGHIJXA1
0.430.400.000.140.290.340.990.450.790.27XA2
0.790.090.000.110.210.150.760.250.540.14XB1
0.000.960.010.050.060.030.100.070.060.05XB2
0.020.910.080.110.130.070.190.150.090.00XC1
0.220.070.370.680.350.000.440.280.300.11XC2
0.340.160.160.830.520.000.470.400.460.26XD1
0.270.050.520.740.320.190.350.250.000.07XD2
0.240.020.690.650.500.230.370.270.000.06XE1
0.050.050.000.070.900.070.020.050.060.10XE2
0.620.150.620.430.770.000.540.530.070.61XF1
0.350.220.000.520.480.890.280.600.390.56XF2
0.290.070.000.430.340.820.290.510.180.58XG1
0.250.210.310.000.160.280.970.260.190.37XG2
0.110.190.060.000.150.170.910.180.270.15XH1
0.000.010.110.240.130.030.180.840.070.29XH2
0.260.120.260.090.020.150.240.920.220.00XI1
0.220.100.000.270.080.140.160.250.860.46XI2
0.140.150.090.000.140.290.280.160.930.12XJ1
0.180.000.150.220.120.090.180.180.200.95XJ2
0.230.420.210.000.200.210.030.330.290.89
表1
每类取3个训练样本情况下10×2个测试图像后验概率
选取前t个特征值对应的特征向量,它就构成了降维后的特征脸子空间W。
其中,N是总的特征向量个数,t是要选取的特征向量个数。
1.3.2人脸图像主分量的提取
主分量是样本图像在特征脸子空间的投影,计算方法为做
内积。
主分量是代表每个图像的特征向量,能够用来表征每个图像的主要信息。
将训练样本图像向特征脸子空间W投影,利用公式Q=WTx得到的系数向量作为下一级分类器的输入数据。
2BP神经网络识别策略
神经网络可以看作是一个函数映射,适用于有明确的输入
与输出的对应关系,但其中的函数不容易确定的问题。
而人脸识别可以看成将人脸图像的主分量作为输入,图像属于哪一类人的判别为输出的复杂函数映射问题。
因此,可以用BP神经网络作为人脸识别器进行识别[6]。
2.1训练集和测试集
设有M类人脸图像,将已知图像{xk}在特征脸子空间的投
影{qk}作为BP神经网络的输入,当x∈第j类时,相应的输出为y=(y1,y2,…,yM满足yj=1、yi≠j=0,则集合{xk}为训练集,集合{qk,
yk}构成BP神经网络的学习数据集,用以确定网络结构和权系数。
未知待测图像x
#在特征脸子空间的投影q$,集合{x#}称为测试集,其在BP神经网络识别器的输出作为分类的依据。
2.2BP神经网络识别器
BP神经网络识别器由一个三层BP神经网络和后验概率
转换器组成。
2.2.1
BP神经网络
三层BP网络输入节点为m个(与pk同维,输出节点为M个,隐节点为r个,输入层到隐层的激活函数采用Sigmoid型,隐层到输出层的激活函数采用线性函数purelin函数,可得网络输入与输出的关系:
y!
k=r
j=1
%vj・f
m
i=1
%wij
・
pi+!
j
&’(k=1,2
…,N
其中,wij为连接权值,!
j为阀值,yk为期望输出,y
!
k为网络的实际输出。
网络的性能函数为最小均方误差函数。
设定网络总的误差小于ε,则有
E=12
N
k=1
%[yk
-y
!
k]2
≤ε2.2.2
后验概率转换器
为保证期望输出yk满足后验概率0≤pk≤1的表示要求,
根据yk与1的偏差程度,定义如下的后验概率:
pk=1-
|1-yk|
max{|1-yk|}
0≤pk≤1
分类采用最大后验概率分类方法,即
j={k|max
(pk}3算法流程
总结以上过程,基于BP神经网络的主分量分析人脸识别
的算法基本步骤如下:
(1读入人脸库;
(2人脸图像通过小波变换预处理;(3构造平均脸及偏差矩阵;(4生成矩阵C,构造特征脸子空间;
(5计算训练样本在特征脸子空间上的投影向量,生成训练集的人脸图像主分量;
(6计算测试样本在特征脸子空间上的投影向量,生成测试集的人脸图像主分量;
(7将(5得到的训练集主分量作为BP神经网络输入进行训练、学习;
(8将(6得到的测试主分量作为BP神经网络的输入进行测试,得到图像对应的后验概率;
(9利用最大后验概率生成识别结果向量。
4实验及结果分析
实验人脸样本图像取自英国剑桥大学的ORL人脸数据
库,ORL数据库由40个人的图像组成,每个人有10幅不同的图像,每幅图像为112×92像素,256级灰度图,它们是在不同时间、光照略有变化、不同表情(眼睛张或闭,笑或不笑以及不同脸部细节(有眼镜或没眼镜下获取的。
依照前述所设计的识别算法,在Matlab6.0下进行实验,研究算法的可行性及识别率与训练集的关系。
4.1实验结果
取10类人脸,分别对每类人脸依次取3幅和6幅图像,构
成30幅和60幅图像的训练集;在每类图像中各取2幅,共20幅图像组成测试集。
计算得到各测试集的属于各类人的后验概率如表1、
表2所示。
其中K={A,B,…,J}表示10类人脸;XKi表示测试集的图像,i=1,2。
每幅图像的最大后验概率用加粗的数字表示,错误识别的图像的后验概率下加下划线表示。
4.2实验结果分析
根据表1数据,在每类取3个训练样本情况下,20幅图像
中16幅图像均判别正确,正确识别率为80%。
根据表2数据,
228
2007,43(36
SNR=10lg‖x-x0‖2
‖x-x′‖2
dB
其中:
x为原始高分辨率图像,x
为评估参考图,x′为高分辨率图像重建结果。
采用两组数据进行测试。
每组对采样的低分辨率图像分别叠加10dB、20dB、30dB、40dB的高斯噪音。
第一组测试数据使用较高的高斯噪音叠加到系统矩阵,其方差为σ2=8.99E-4,;第二组测试数据采用较低的噪音,其方差为σ2=8.99E-9。
为了测试TLS算法的性能,还使用了最小二乘法(LS进行测试,比较结果如图3。
其横轴为图像噪音,纵轴为SNR,单位为10的幂次。
对于扰动较大的噪音,TLS结果明显好于LS方法,如图3(a所示;对于扰动较小的噪音,LS方法好于RTLS方法。
这说明RTLS方法对于干扰较大的系统是比较
适合的。
图2中(d、(e分别表示使用方差8.99E-4较高的高斯噪音叠加到系统矩阵和图像噪音为40dB时两种算法计算的结果。
由RTLS算法给出的结果如图2(d,明显好于LS算法给出的结果如图2(e。
6结论
本文提出使用整体最小二乘方法来求解高分辨率重建问题。
由于系统矩阵不是卷积产生的,因此使用共轭梯度方法求解。
将
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BP 神经网络 分量 分析 识别 算法 概要