书签分享收藏举报版权申诉 / 25

立即下载加入VIP,免费下载

当前位置：首页 > 经管营销 > 经济市场 > 基于BP神经网络的主分量分析人脸识别算法概要.docx

基于BP神经网络的主分量分析人脸识别算法概要.docx

文档编号：17048025
上传时间：2023-07-21
格式：DOCX
页数：25
大小：27.74KB

《基于BP神经网络的主分量分析人脸识别算法概要.docx》由会员分享，可在线阅读，更多相关《基于BP神经网络的主分量分析人脸识别算法概要.docx（25页珍藏版）》请在冰点文库上搜索。

基于BP神经网络的主分量分析人脸识别算法概要.docx

基于BP神经网络的主分量分析人脸识别算法概要

ComputerEngineeringandApplications计算机工程与应用2007,43（36

人脸识别技术就是利用计算机技术对人脸图像进行分析,从中提取有效的特征来识别出人的身份,其关键技术在于人脸特征的描述和模式识别。

目前,根据人脸表征方式的不同,分为三大类:

基于几何特征的识别方法、基于代数特征的识别方法和基于神经网络的识别方法。

基于几何特征的识别法是提取人脸的几何特征,根据特征点的性质进行识别,Poggio和Brunelli[1]用改进的积分投影法提取出欧氏距离表征的35维人脸特征矢量用于模式分类,但是该方法没有形成一个统一、优秀的特征提取标准。

基于代数特征的识别法是提取人脸的代数特征,运用代数运算进行分析然后识别。

Turk和Pentland[2]提出了“特征脸”方法,该方法根据一组投影系数,和各个已知的人脸图像比较识别,由于代数特征矢量（即人脸图像向特征脸空间的投影具有一定的稳定性,识别系统对不同的表情有一定的鲁棒性。

但是,这也说明了这种方法对表情的描述不够充分,难以用于表情分析。

神经网络识别法则是通过神经网络的训练学习,得到相应的识别函数关系,从而进行识别。

Kohonen[3]率先运用自相关记忆（全互联神经网络存储和重建人脸图像,表明了自相关神经元具有识别能力。

神经网络在结构上更类似于人脑,在编码压缩与信息处理方式等方面具有一定的优势。

但由于原始灰度图像数据量十分庞大,训练时间通常很长。

本文提出了基于主分量分析（PCA与BP神经网络的人脸识别算法,该算法利用小波变换（WaveletTransform的多分辨率分析对原始灰度图像数据进行数据压缩、去噪声,得到低频小波子图,克服了PCA数据庞大带来的不便,再根据BP神经网络较强的学习、归纳分类能力,得到人脸主分量与所属人类别的函数映射关系,从而实现人脸识别。

本方法是一种快速、实用、有效的人脸识别方法。

1基于PCA的人脸特征的描述和提取

1.1图像的数学描述

人脸都含自己的内在特征,人脸识别的关键在于寻找这些内在特征。

将一幅人脸图像表示成一个m维列向量,其中m=图像的像素数=width×height=w×h,即将第i个样本的灰度图像表示成向量x=[x

1

x2,…,xm]的形式。

设有M个人,每个人有n幅图像,

基于BP神经网络的主分量分析人脸识别算法

赵立强1,张晓华1,2,高振波3,张洪亮1

ZHAOLi-qiang1,ZHANGXiao-hua1,2,GAOZhen-bo3,ZHANGHong-liang1

1.河北科技师范学院数理系,河北秦皇岛066004

2.哈尔滨理工大学计算机科学与技术学院,哈尔滨150080

3.河北科技师范学院计算机系,河北秦皇岛066004

1.DepartmentofMathematicsandPhysics,HebeiNormalUniversityofScienceandTechnology,Qinhuangdao,Hebei066004,China

2.CollegeofComputerScienceandTechnology,HarbinUniversityofScienceandTechnology,Harbin150080,China

3.DepartmentofComputer,HebeiNormalUniversityofScienceandTechnology,Qinhuangdao,Hebei066004,China

E-mail:

zhao_liqiang@

ZHAOLi-qiang,ZHANGXiao-hua,GAOZhen-bo,etal.FacerecognitionbasedonBPnuralnetworksandprinciplecom-ponentanalysis.ComputerEngineeringandApplications,2007,43（36:

226-229.

Abstract:

BPneuralnetworkcombinedwithprincipalcomponentanalysisisappliedtohumanfacerecognition.Afterextractinglowfrequencysub-bandoffaceimageinwavelettransform,theeigenfacespaceisconstructedbyPCA.Thenallsamplesarepro-jectedintothesubspace,thecoefficientofeverysampleisinputtedtoBPneuralnetwork,andthefacerecognizerconsistsofBPneuralnetworkandpost-probabilityconverter.TheexperimentsonORLfacedatabaseindicatetherecognitionratioisgreatlyim-proved.

Keywords:

facerecognition;BPneuralnetwork;principlecomponentanalysis（PCA;wavelettransform

摘要:

提出了基于BP神经网络的主分量人脸识别算法。

该算法首先用小波变换对人脸图像进行小波分解,形成低频小波子图,然后用主分量分析法构造特征脸子空间,将人脸图像在特征空间的投影作为BP神经网络的输入,由BP神经网络和后验概率转换器构成人脸识别器。

针对ORL人脸库的实验结果表明该方法具有较高的识别率。

关键词:

人脸识别;BP神经网络;主分量分析（PCA;小波变换

文章编号:

1002-8331（200736-0226-04文献标识码:

A中图分类号:

TP391.41

作者简介:

赵立强（1967-,男,副教授,博士,主要研究方向:

机器视觉;张晓华（1979-,女,助教,硕士,主要研究方向:

图像处理与模式识别;高振波（1967-,男,实验师,主要研究方向:

计算机信息处理;张洪亮（1984-,女,硕士,主要研究方向:

图像处理。

226

2007,43（36

即有N=M×n个样本。

1.2小波变换人脸图像去噪声、数据压缩

小波变换（WaveletTransform相当于滤波器的作用,每次

把图像分解为长度减半的一个低频分量和一个高频分量,而总

的数据量未变,其中低频分量为平滑部分,高频分量为细节部

分。

利用小波函数将图像信号通过多分辨率分析推广到二维情

况[4]。

将二维数字信号（即数字图像X

w×h

看作s!

f（h,w,即

s!

f（h,w=

R2

""f（x,y!

（x-h,y-wdxdy

其中!

（x,y为二维尺度函数:

!

（x,y=!

（x!

（y,!

（x、!

（y

是多分辨率空间{Vj2}

j∈Z

的一维尺度函数。

对人脸图像小波分解

的物理意义如图所示,图1（a表示原始的人脸图像,图1（b表示对一幅人脸图像进行1级小波变换分解得到的结果,图1（c表示对一幅人脸图像进行2级小波变换分解得到的结果。

从图中可见,虽然对数据进行了压缩,图像依然清晰度很高,即虽然图像的信息容量有所减小,但小波域的能量并未减小很多,图像的信息量仍然很大,可以进行下一步的特征提取。

1.3人脸图像的主分量提取

主分量是统计学中分析数据的一种有效的方法,其目的是在数据空间中找一组向量以尽可能地解释数据的方差,将数据从原来的N维空间降维投影到M维空间（N>>M,在降维后保存了数据中的主要信息,从而使数据更易于处理。

一幅N×M大小的人脸图像可以按列相连而构成一个NM维的列向量,该向量可看成是NM维空间中的一个点。

由于人脸结构的相似性,人脸图像在这一高维空间中不是随机或散乱地分布的,而是存在着一定的规律性。

因此可以通过K-L变换用一个低维子空间描述人脸图像,同时又可以保留所需要的识别信息。

1.3.1人脸特征子空间的构造

读入小波变换之后得到的人脸低频特征,将第i幅人脸图像看作一个一维向量,记为x

i

则该向量的协方差矩阵可以表示为:

C=1N

N

i=1

$（xi-x%（xi-x%T=1NDDT

其中,x%=

1N

i=1

$xi为训练样本集的均值向量,N为训练样本的总

个数,D=x

i

-x%。

由于C为对称矩阵,可以将其对角化

C=U!

UT=

R

i=1

$"iuiuTi

其中"i为C的特征值,u

i

为相应的特征向量,{u

1

u2,…,uR}为标

准正交基,R为协方差矩阵C的秩,!

为对角阵,对角线上的元素为C的各特征值。

通常协方差矩阵C的维数较大,如果直接计算它的特征值和正交归一化特征向量,计算量很大。

而对于任意实矩阵Am×n,都可以利用奇异值分解将其转换为对角阵。

因此可以采用奇异

值分解来进一步降维。

引理1（SVD[5]令A

m×n

是实矩阵（不失一般性,假设m≥n,且rank（A=k,则存在两个正交矩阵Um×m和Vn×n以及对角

阵D

m×n

使得下式成立

A=UDVT（1其中:

Dm×n=

k×k

$0

’

（

（（

*

+

++

k×k

$=diag（#1,#2,…,#k

Um×m=（u1,u2,…,uk,uk+1,…,um

Vn×n=（v1,v2,…,vk,vk+1,…,vn

式中#

i

=i

-i=1,2,…,k,…,n称为矩阵A的奇异值,"1≥"2≥,…,≥"k>0是AAT并且也是ATA的非零特征值的全体,

而"

k+1

="k+2=,…,="n=0为ATA的n-k个零特征值。

ui、vi（i=1,2,…,k分别是AAT和ATA对应于非零特征值"i的特征向量。

ui（i=k+1,…,m是为了表达上的方便而引入的（m-k个向量,

可以设想它是AAT对应于"

i

=0的特征向量。

同理,vi（i=k+1,…,n为ATA对应于"i=0的特征向量。

将式（1写成乘积的形式:

A=

K

i=1

$#iuivTi（2

设U

k

={u1,u2,…,uk},Vk={v1,v2,…,vk},则式（2可以表示为A=Uk

k×k

$Vk

从而可得U

k

=AVk

k×k

$-1,为AAT非零特征值"i对应的特征向量构成的矩阵。

由上述的引理容易求出协方差矩阵C的正交归一化特征向量为:

ui=1

i

-

xvi,i=1,2,…,N

如果矩阵A代表一幅人脸图像,式（2就是该人脸图像进

行了正交分解,对于任何实矩阵,在"

1

≥"2≥,…,≥"k>0的限制下,奇异值对角阵是唯一的,因此原人脸图像A对应的奇异值特征向量也是唯一的。

这些特征向量所代表的就是人脸的代数特征,称为“特征脸”。

若将第i幅人脸图像向量x

i

在特征向量u

i

上的投影记为

P

u

i

则有Pu

i

=uixi。

令P

u

={P

u1

P

u2

…,P

uR

}=UT-1xi,则P

u

的协方差矩阵为:

E[（Pu-P.u（Pu-P.uT]=UTE[（xi-x%i（xi-x%iT]U=UTCU=!

由此可见,x

i

在特征向量u

i

上的投影的方差就是ui

对应

的特征值"

i

并且各投影之间互不相关。

因此特征值越大,与之对应的特征向量对方差的贡献也就越大,为此依照公式

t=min

k

i=1

$ui

N

i=1

$ui

≥0.9,k≤

2

22

1

2

22

3

4

2

22

5

2

22

6

t

赵立强,张晓华,高振波,等:

基于BP

神经网络的主分量分析人脸识别算法227

ComputerEngineeringandApplications计算机工程与应用

2007,43（36ABCDEFGHIJXA1

0.430.400.000.140.290.340.990.450.790.27XA2

0.790.090.000.110.210.150.760.250.540.14XB1

0.000.960.010.050.060.030.100.070.060.05XB2

0.020.910.080.110.130.070.190.150.090.00XC1

0.220.070.370.680.350.000.440.280.300.11XC2

0.340.160.160.830.520.000.470.400.460.26XD1

0.270.050.520.740.320.190.350.250.000.07XD2

0.240.020.690.650.500.230.370.270.000.06XE1

0.050.050.000.070.900.070.020.050.060.10XE2

0.620.150.620.430.770.000.540.530.070.61XF1

0.350.220.000.520.480.890.280.600.390.56XF2

0.290.070.000.430.340.820.290.510.180.58XG1

0.250.210.310.000.160.280.970.260.190.37XG2

0.110.190.060.000.150.170.910.180.270.15XH1

0.000.010.110.240.130.030.180.840.070.29XH2

0.260.120.260.090.020.150.240.920.220.00XI1

0.220.100.000.270.080.140.160.250.860.46XI2

0.140.150.090.000.140.290.280.160.930.12XJ1

0.180.000.150.220.120.090.180.180.200.95XJ2

0.230.420.210.000.200.210.030.330.290.89

表1

每类取3个训练样本情况下10×2个测试图像后验概率

选取前t个特征值对应的特征向量,它就构成了降维后的特征脸子空间W。

其中,N是总的特征向量个数,t是要选取的特征向量个数。

1.3.2人脸图像主分量的提取

主分量是样本图像在特征脸子空间的投影,计算方法为做

内积。

主分量是代表每个图像的特征向量,能够用来表征每个图像的主要信息。

将训练样本图像向特征脸子空间W投影,利用公式Q=WTx得到的系数向量作为下一级分类器的输入数据。

2BP神经网络识别策略

神经网络可以看作是一个函数映射,适用于有明确的输入

与输出的对应关系,但其中的函数不容易确定的问题。

而人脸识别可以看成将人脸图像的主分量作为输入,图像属于哪一类人的判别为输出的复杂函数映射问题。

因此,可以用BP神经网络作为人脸识别器进行识别[6]。

2.1训练集和测试集

设有M类人脸图像,将已知图像{xk}在特征脸子空间的投

影{qk}作为BP神经网络的输入,当x∈第j类时,相应的输出为y=（y1,y2,…,yM满足yj=1、yi≠j=0,则集合{xk}为训练集,集合{qk,

yk}构成BP神经网络的学习数据集,用以确定网络结构和权系数。

未知待测图像x

#在特征脸子空间的投影q$,集合{x#}称为测试集,其在BP神经网络识别器的输出作为分类的依据。

2.2BP神经网络识别器

BP神经网络识别器由一个三层BP神经网络和后验概率

转换器组成。

2.2.1

BP神经网络

三层BP网络输入节点为m个（与pk同维,输出节点为M个,隐节点为r个,输入层到隐层的激活函数采用Sigmoid型,隐层到输出层的激活函数采用线性函数purelin函数,可得网络输入与输出的关系:

y!

k=r

j=1

%vj・f

m

i=1

%wij

・

pi+!

j

&’（k=1,2

…,N

其中,wij为连接权值,!

j为阀值,yk为期望输出,y

!

k为网络的实际输出。

网络的性能函数为最小均方误差函数。

设定网络总的误差小于ε,则有

E=12

N

k=1

%[yk

-y

!

k]2

≤ε2.2.2

后验概率转换器

为保证期望输出yk满足后验概率0≤pk≤1的表示要求,

根据yk与1的偏差程度,定义如下的后验概率:

pk=1-

|1-yk|

max{|1-yk|}

0≤pk≤1

分类采用最大后验概率分类方法,即

j={k|max

（pk}3算法流程

总结以上过程,基于BP神经网络的主分量分析人脸识别

的算法基本步骤如下:

（1读入人脸库;

（2人脸图像通过小波变换预处理;（3构造平均脸及偏差矩阵;（4生成矩阵C,构造特征脸子空间;

（5计算训练样本在特征脸子空间上的投影向量,生成训练集的人脸图像主分量;

（6计算测试样本在特征脸子空间上的投影向量,生成测试集的人脸图像主分量;

（7将（5得到的训练集主分量作为BP神经网络输入进行训练、学习;

（8将（6得到的测试主分量作为BP神经网络的输入进行测试,得到图像对应的后验概率;

（9利用最大后验概率生成识别结果向量。

4实验及结果分析

实验人脸样本图像取自英国剑桥大学的ORL人脸数据

库,ORL数据库由40个人的图像组成,每个人有10幅不同的图像,每幅图像为112×92像素,256级灰度图,它们是在不同时间、光照略有变化、不同表情（眼睛张或闭,笑或不笑以及不同脸部细节（有眼镜或没眼镜下获取的。

依照前述所设计的识别算法,在Matlab6.0下进行实验,研究算法的可行性及识别率与训练集的关系。

4.1实验结果

取10类人脸,分别对每类人脸依次取3幅和6幅图像,构

成30幅和60幅图像的训练集;在每类图像中各取2幅,共20幅图像组成测试集。

计算得到各测试集的属于各类人的后验概率如表1、

表2所示。

其中K={A,B,…,J}表示10类人脸;XKi表示测试集的图像,i=1,2。

每幅图像的最大后验概率用加粗的数字表示,错误识别的图像的后验概率下加下划线表示。

4.2实验结果分析

根据表1数据,在每类取3个训练样本情况下,20幅图像

中16幅图像均判别正确,正确识别率为80%。

根据表2数据,

228

2007,43（36

SNR=10lg‖x-x0‖2

‖x-x′‖2

dB

其中:

x为原始高分辨率图像,x

为评估参考图,x′为高分辨率图像重建结果。

采用两组数据进行测试。

每组对采样的低分辨率图像分别叠加10dB、20dB、30dB、40dB的高斯噪音。

第一组测试数据使用较高的高斯噪音叠加到系统矩阵,其方差为σ2=8.99E-4,;第二组测试数据采用较低的噪音,其方差为σ2=8.99E-9。

为了测试TLS算法的性能,还使用了最小二乘法（LS进行测试,比较结果如图3。

其横轴为图像噪音,纵轴为SNR,单位为10的幂次。

对于扰动较大的噪音,TLS结果明显好于LS方法,如图3（a所示;对于扰动较小的噪音,LS方法好于RTLS方法。

这说明RTLS方法对于干扰较大的系统是比较

适合的。

图2中（d、（e分别表示使用方差8.99E-4较高的高斯噪音叠加到系统矩阵和图像噪音为40dB时两种算法计算的结果。

由RTLS算法给出的结果如图2（d,明显好于LS算法给出的结果如图2（e。

6结论

本文提出使用整体最小二乘方法来求解高分辨率重建问题。

由于系统矩阵不是卷积产生的,因此使用共轭梯度方法求解。

将

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 BP 神经网络分量分析识别算法概要

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：基于BP神经网络的主分量分析人脸识别算法概要.docx
链接地址：https://www.bingdoc.com/p-17048025.html

基于BP神经网络的主分量分析人脸识别算法概要.docx

热门标签