人脸识别算法文档格式.docx
- 文档编号:6882542
- 上传时间:2023-05-07
- 格式:DOCX
- 页数:28
- 大小:511.71KB
人脸识别算法文档格式.docx
《人脸识别算法文档格式.docx》由会员分享,可在线阅读,更多相关《人脸识别算法文档格式.docx(28页珍藏版)》请在冰点文库上搜索。
PCAAlgorithm
第一章引言
1.1立题背景
随着电子计算机技能的进步和社会的高度发展,人们对高效牢靠的身份判别的需求愈来愈高。
各种技术在研究和实践中受到重视。
由于生物特性内在的稳定性和独特性,成为身份鉴别的理想依据。
而人脸作为生物特性的典型特征,也是一个很好的隐藏,容易被用户所接受,且不需要配合的其他优点。
已成为身份研究领域的热点。
PCA算法减小维数,提取主要元素,减少数据冗余,解决图象过高,缓慢处理或处理的问题。
在脸部识别范畴,在其基础上改良了大批深奥的判别算法。
所以,基于PCA人脸判别算法的探寻具有重要的参考价值和现实意义。
1.2国内外研究现状
20世纪60年代末至70年代初,人脸识研究刚刚起步。
最早的研究者是Bledsoe,他建立了一个半自动的人脸识别系统,主要是以人脸特征点的间距、比率等参数为特征。
20世纪90年代以来,对着计算机软硬件性能的迅速提高,以和对人脸识别能力的高要求,是发展更具鲁棒性[2]的人脸识别方法称为时代的必然。
于是基于整体的识别方法营运而生,并且很快成了研究的重点,如特征脸方法和弹性图匹配方法。
90年代中期以来,人脸识别方法想着整体识别和部件分析相结合的趋势发展。
研究人员开始逐渐认识到人脸识别算法必须能充分地利用人脸的各种特征信息,融合人脸的形状拓扑结构特征、局部灰度特征和全局灰度分布特征等多种特征。
因此,出现了很多新的算法,这些算法是将原先单一的算法结合起来,共同完成人脸的识别。
灰度和形状分离的可变形模型方法就是其中之一。
1.3选题目的和意义
随着安全入口控制和金融贸易方面应用需要的快速增长,生物统计识别技术得到了新的重视。
目前,微电子和视觉系统方面取得的新进展,使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度。
而人脸识别是所有的生物识别方法中应用最广泛的技术之一,人脸识别技术是一项近年来兴起的一种新型的身份识别技术,它是生物识别技术的一种。
随着人们应用需求的不断深入,人脸识别技术将呈现出主流化、芯片化、标准化发展趋势。
近年来受到了各国研究人员的普遍关注,主要用于安全保密等领域。
人们更多的是在电影中看到这种技术的神奇应用:
警察将偷拍到的嫌疑犯的脸部照片,输入到电脑中,与警方数据库中的资料进行比对,并找出该嫌犯的详细资料和犯罪记录。
这并非虚构的情节。
在国外,人脸识别技术早已被大量使用在国家重要部门以和军警等安防部门。
在国内,对于人脸识别技术的研究始于上世纪90年代,目前主要应用在公安、金融、网络安全、物业管理以和考勤等领域。
人脸识别按照信息来源可分为两类:
基于静态人脸图像的识别和基于动态信息的识别。
由于动态识别研究处于起步阶段,该技术相对较欠缺,因此本文只研究基于静态人脸图像的识别方法。
1.4课题主要研究内容和关键问题
1.系统的主要功能:
可以使用笔记本电脑进行图像采集,图像抓取,人脸库训练,人脸定位,灰度化和人脸识别。
2.关键问题:
人脸定位问题,光照问题,人的姿态问题以和遮挡问题等。
1.5论文组织架构
第一章,引言介绍了人脸识别在各个领域的研究背景,课题研究的主要内容以和课题研究遇到的关键问题。
第二章,介绍了人脸识别主要应用的技术,以和相关技术之间的联系。
第三章,介绍了模拟银行柜员机系统,说明了开发此系统用的开发语言和运用的环境,以和对其进行基本的功能说明。
第四章,介绍了人脸识别系统的算法设计。
第五章,介绍了人脸识别系统的具体实现,包含人脸识别流程,以和人脸识别的具体步骤,最后成功的实现对人脸的识别。
第六章,对人脸识别PCA算法进行了总结。
第二章技术简介
2.1人脸检测技术
人脸检测是指在动态的场景与复杂的背景中判断是否存在面像,并分离出这种面像。
一般有下列几种方法:
①参考模板法
首先设计一个或数个标准人脸的模板,然后计算测试采集的样品与标准模板之间的匹配程度,并通过阈值来判断是否存在人脸;
②人脸规则法
由于人脸具有一定的结构分布特征,所谓人脸规则的方法即提取这些特征生成相应的规则以判断测试样品是否包含人脸;
③样品学习法
这种方法即采用模式识别中人工神经网络的方法,即通过对面像样品集和非面像样品集的学习产生分类器;
④肤色模型法
这种方法是依据面貌肤色在色彩空间中分布相对集中的规律来进行检测。
⑤特征子脸法
这种方法是将所有面像集合视为一个面像子空间,并基于检测样品与其在子空间的投影之间的距离判断是否存在面像。
2.2图像预处理技术
2.2.1灰度化
人脸识别的对通常是灰色图象。
灰度图只含有亮度消息,灰度图的亮度是持续转变的,是以灰度图象量化亮度值分为:
0-255,共256个品级。
所有黑色为0,其它全255表现为全亮。
常用的经验公式为灰色=0.39*R+0.5*G+0.11*B。
2.2.2二值化
二值化是通过选择适当的阈值将灰度图象的灰度值从0变换为255,将其转换为只有0和255的黑白图象。
在面部识别中,两个值用于将头发,眼睛,脸部和脸部从明亮区域分开。
在图二值化过程当中采取恰当的阈值是十分重要的。
而我们经常使用的图二值选择要领有如下的方式:
全局阈值法:
两个值在t的两个,只有一个全局阈值的范围内,不会有两个假设图像是
,灰度范围是
,T在
和
之间选择一个合适的灰度值,转换后的图像
,然后转换关系:
局部阈值法:
它是按照当前象素的灰度值和部分灰度值附近的象素来判定详细阈值的大小的。
动态阈值法:
其阈值不仅与象素和周围象素有关,而且与象素的坐标有关。
整体阈值法适合图象质量较好的条件下,此时图象直方图有两个峰值。
局部阈值法可以在更为复杂的情况处理下处理图,但还是会有少数情形被歪曲。
动态阈值法的可兼容性和机能都不错,事实上做人脸识别都会使用动态的方法来进行二值化的过程。
2.2.3直方图均衡
直方图均衡化是一种比较均匀分布的灰度分量,通常用于增强人脸图像的对比度。
此外,它可以减少照明对脸部图象的影响,使面部特征提取更容易,提高脸部图象的主观质量。
它是在图灰度分布的基础上和现实情况下的需要来选择恰当的映射函数。
选取功能可分为平滑功能或分段功能。
当映射函数是分段函数时,凡是在面部图中目标的细节,而且不想损失其余灰度值的细节。
这可能需要细节的灰度值间隔能够自由拉伸,并且不会锁死,而且需要不是很重要的细节被压成一团。
2.2.4图象锐化
图象锐化用于解决图象提取,图象传输和相关处理的问题。
图象模糊是由图象的平均或积分操作引起的,图象可以反转,使图象清晰。
但是,图象的锐化还需要一些必要的条件,我们获取的图一定要有较高的信噪比,不然会产生的结果会致使较低的信噪比。
在实践中,图象中的第一个滤波噪声锐化。
常用的是拉普拉斯锐化图象锐化方法。
2.2.5图象归一化
图象归一化包括灰度归一化和几何归一化。
灰度归一化是使均匀灰度的图象的不同灰度值。
其目的是减少照明的变化和灰度的变化。
2.3人脸特征提取技术
特征提取是图象处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。
它检查每个像素来确定该像素是否代表一个特征。
假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。
作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。
此后通过局部导数运算来计算图像的一个或多个特征。
2.4人脸比对技术
面貌比对是对被检测到的面貌像进行身份确认或在面像库中进行目标搜索。
这实际上就是说,将采样到的面像与库存的面像依次进行比对,并找出最佳的匹配对象。
所以,面像的描述决定了面像识别的具体方法与性能。
主要采用特征向量与面纹模板两种描述方法:
①特征向量法
该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,而这些特征量形成一描述该面像的特征向量。
②面纹模板法
该方法是在库中存贮若干标准面像模板或面像器官模板,在进行比对时,将采样面像所有象素与库中所有模板采用归一化相关量度量进行匹配。
此外,还有采用模式识别的自相关网络或特征与模板相结合的方法。
人脸识别技术的核心实际为“局部人体特征分析”和“图形/神经识别算法。
”这种算法是利用人体面部各器官和特征部位的方法。
如对应几何关系多数据形成识别参数与数据库中所有的原始参数进行比较、判断与确认。
一般要求判断时间低于1秒。
2.5人脸识别的难点
人脸辨别技术发展前景非常好,但是还有有一些难点会限制它的发展,从而让它无法像普通锁一样全面应用于整个社会,甚至是应用于整个世界,所以我们还需要更深一步的加强人脸识别的研究。
2.5.1复杂条件下关键点定位问题
关键点定位在人脸辨别系统的前端处理模块,它直接关系到人脸识别系统的识别效果。
复杂条件下的关键点位置是要解决的迫切问题之一。
目前,还没有十分完美的关键点定位方法,仍然需要我们去进一步的研究。
2.5.2姿态问题
人脸识别算法主要基于正面姿态。
当面部姿势不正时,人脸识别度会突然下降。
怎么升高人脸辨别系统对人们各种各样的姿态识别的准确度是脸部识别中的一项拥有建设性的挑战。
2.5.3表情问题
表情是人类计算机互动的一个重要组成部分,但很难用精确的数学模型表达。
因为当下计算机技术的缺陷和不足,微型计算机没法无误的定位这些脸部特性,也无法区别面部肌肉活动的情况。
而且,不同的表达方式没有固定的界限,不同的人会有不同的表情呈现出来。
2.5.4遮挡问题
由于收集到的脸部图象不一定完整,因此会影响脸部特征提取和识别,并可能导致脸部检测算法失败。
如何有效消除遮挡的影响具有重要意义。
2.5.5光照问题
光照问题在脸部识别中非常明显。
但是,以目前的光照处理技术远不和实际的需要应用水平。
人们还要加强研究。
2.6本章小结
本章主要介绍了人脸识别需要的技术,其中人脸检测技术用来判断待处理的图像中是否有人脸,图像预处理技术,则是为了去除到图像中不需要的模块,以便人脸比对可以减少误差,保证人脸识别的准确率。
第三章模拟柜员机系统的概述
3.1柜员机系统诞生的背景
随着科学技术的发展,社会文明的进步,金融行业的发展,柜员机系统在金融行业的使用频率愈来愈高。
因为柜员机系统的方便性,便利性以和可以减少用户去柜台办理业务的麻烦,它在银行以和其它行业越来越受欢迎。
3.2模拟柜员机系统开发的意义
对普通大众来说,基于图象分析的柜员机系统方便了人们的生活。
人们不需要每次办理业务的时候都要去银行的柜台办理,现在可以直接在柜员机上实现基本的存款,取款,转账和查询等功能。
当然,对于银行工作人员也是十分便利的。
它不仅减少了银行工作人员的工作量,而且也提高了银行工作人员的工作效率。
3.3模拟柜员机系统的介绍
3.3.1开发语言
此柜员机系统,我们是使用当下近乎完美的Java语言开发的。
对于开发柜员机系统的人来说,比较容易上手。
3.3.2开发环境
我们使用了MyEclipse作为开发工具,并配置JDK开发环境和JRE运行环境。
数据库使用了MySql数据库。
因为开发成本问题和为了更方便的维护,其系统我们采用B/S架构(浏览器/服务器模式)。
为了方便管理此系统我们将此系统分为了用户前台和管理员后台。
使得人与系统的交互性更强了。
3.3.3模拟柜员机系统界面介绍
从图3.1,可以看出这是开发柜员机系统人员设计的登录界面。
其中分为用户登录和管理员登录。
而分为两种类型的用户登录,则是为了管理此系统,使得此系统的实用性更强。
图3.1柜员机系统的登录界面
图3.2,则是普通用户登录进去可以实现的功能。
我们可以看到,普通用户具有4种基本功能查询余额,存款,取款以和转账。
当然用户也可以修改密码。
图3.2普通用户界面
图3.2中显示的信息不多是因为用户的权限不多,设计之初只是为了让其可以进行简单的存取款,查询账户余额以和转账和修改密码功能。
如果用户还要其它功能,则必须去柜台办理,这样也是为了方便管理模拟柜员机系统。
图3.3,则是管理界面。
管理员具有多种权限,可以管理普通用户,为客户开户以和普通用户的所有功能。
图3.3管理员界面
从管理员界面我们可以看出,管理员的权限比普通用户要多上许多。
这样的设计也是为了让银行工作人员更方便的工作,从而提高其工作效率,减少其工作量。
图3.4,则是模拟柜员机系统调用人脸识别的窗口,主要是用来判定登录这个模拟柜员机卡号的是不是本人。
图3.4模拟柜员机给人脸识别的界面
当我们点击开启摄像头时,会在界面的左边弹出一个调用摄像头的界面,用于采集人脸图象,而右边的窗口则是用于比对人脸和训练人脸库的头像的。
抓取图象就是类似于截屏功能,把摄像头采集的人脸用于和训练样本进行比较,最后识别出效果。
3.4模拟柜员机系统与人脸识别的交互
在研究之初,对于此课题我有两种想法。
其一是,当用户输入柜员机系统的密码后,然后弹出人脸识别窗口判断此人是否是持有此卡号的人。
另一种想法是,当用户三次输入密码错误时,我们就弹出人脸识别窗口进行辨认其身份。
图3.5,则介绍了柜员机系统给人脸识别调用的窗口。
图3.5人脸识别窗口
在图3.5中我们设计了人脸识别算法的GUI界面,方便用户使用。
从图中可以看出我们可以调用摄像头进行采集人脸,然后可以进行人脸训练。
之后就会定位人脸,灰度化之后,将会更清楚的看到人脸的轮廓,最后点击检测将会返回一个结果,是否是本人。
如果是本人,将返回一个结果告诉用户这是“本人”。
如果不是本人,也会返回一个结果告诉用户“不是本人”。
由上结果可知,如果返回结果是本人,则拥有此模拟柜员机账号的人可以进行后续的查询,存取款,修改密码以和转账等功能。
如果返回结果是不是本人,本模拟柜员机系统将会进行退卡操作。
第四章人脸识别算法设计
当人脸图象的来源是一幅静态图象时进行的人脸识别属于静态人脸识别。
人脸识别算法包含2部分:
人脸定位和归一化,对于一个全自动的人脸识别系统,整个的识别过程可归纳为人脸检测与定位、特征提取和识别,这两个环节独立性很强,而在许多特定情况下,人脸检测与定位工作比较简单,而“特征提取与识别”环节得到了更为广泛和深入研究。
4.1人脸检测与定位
目前人脸检测还是一个相当困难的工作,其中所面临的问题可以归结如下:
①图像中是否存在人脸:
这是人脸检测不同于其它有关人脸研究工作的地方,即如何判断图像中是否存在人脸,如何区别人脸和类似人脸的非人脸图像。
②检测不同表现形式的人脸:
人脸可能以不同视角出现在图像中,也可能被某些物体遮挡,造成某些用于检测而需提取的人脸特征不可见。
③图像中存在着噪声:
由于成像时亮度、对比度等因素的影响使图像不清晰,人脸与背景区别不大,给检测带来一定的难度。
④人脸自身的因素:
由于人脸结构复杂,某些局部特征具有随机性(如眼镜、胡须、发型等),而且还存在着不同表情的人脸,这些都给人脸检测带来难度。
由此可见,人脸检测是一个复杂而具有挑战性的问题。
任意给定一个图像或者一组图像序列,人脸检测的目的就在于判定该图像或图像序列中是否存在人脸。
如果存在,则返回其位置和空间分布,将所有人脸从背景图象中分割出来,并确定每个人脸在图象中的大小和位置,人脸检测系统的输入是可能包含人脸的图象,输出是关于图象中是否存在人脸以和人脸的数目,位置,尺度等信息的参数化描述。
根据这个定义可知,人脸检测可分为两类:
第一类是在静止图像中判断是否存在人脸,若存在,则定位人脸的位置;
第二类是在视频图像序列中判断是否存在人脸,若存在,则动态地跟踪人脸。
显然,后一种所采用的人脸检测方法要比前一种困难。
人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度,从而得到可能存在人脸的区域。
4.2基于PCA的人脸特征提取
通常得到的数据量直接由图像很大,为了有效地分类识别,是转换原始数据,最能反映分类性质的特征,这是特征提取和选择的过程。
我们称之为由原始数据测量空间组成的空间,称为特征空间分类的空间取决于。
通过转换,我们可以将所述模型的高维空间的测量值放在下模型的特征空间的维度上。
特征空间模型中的表示也称为样本,它通常表示为向量,即特征空间中的单个点。
人脸图像可以看作是一个矢量(如图4.1所示),如果图像的高度和宽度分别为h和w,则对应的矢量维数为w*h,人脸矢量属于一个空间,称为是图像空间。
图4.1人脸矢量示意图
由于每个人脸都非常类似,在相同的位置都有两只眼睛,一个嘴巴,一个鼻子等等,所以在图像空间里所有的人脸矢量都聚集在一个狭窄的区域内(如图4.2所示),所以整个图像空间不是人脸描述的一个优化空间,PCA主元分析法的任务就是构造一个能更好描述人脸的人脸空间,降低空间维数,使新的人脸空间的基向量(又叫主元)能更好地描述典型的人脸模式。
图4.2人脸空间示意图
PCA主元分析法又称Karhunen-Loece(KL)变换,它的目的是降维,人脸空间是典型的高维空间,一个128*128像素的人脸若视为向量,就有16384维,运算极不方便。
若将人脸看作是平稳的高斯过程,就可以利用KL变换提取主元,达到降维的目的。
KL变换是图像压缩的一种最优化变换,高维的图像空间经过KL变换后得到一组新的正交基(主元),保留其中最重要的正交基,由这些正交基可以组成低维线性空间。
如果假设人脸在这些低维线性空间的投影具有可分性,那么就可以把这些投影用作识别的特征向量。
这就是PCA的主要思想。
PCA最早是由统计学发展过来的,然后就被用在人工神经网络理论中,所以对PCA的理论描述可以从两方面进行,一种是从人工神经网络理论这个角度来理解,这样相对来讲比较直观。
另一种就是从统计学角度来理解,这就比较严格,比较难懂,因为这是严格的按照数学的理论来推导出来的。
4.3人脸识别方法
高水平的识别工作一般需要复杂的处理过程,如将图象映射到表面,恢复为三维模型,进行模型匹配等,但基于二维的图象处理也可进行人脸识别,下面介绍常用的几种方法。
4.3.1几何特征法
很多人也将使用面部识别中的几何特征方法。
例如,常用的几何特征具有面部特征如眼睛,鼻子,嘴巴,脸部特征的局部形状特征和面部特征分布在脸部上的几何特征。
通过拓扑先验知识的面部几何关系来提取特征。
在这种基于几何特征的识别中,将其识别为特征向量的匹配,基于欧几里德距离的决策是最常用的识别方法。
面对眼睛,鼻子,嘴巴,下巴等部位,由于这些部件的形状,尺寸和结构各不相同,使得世界各个面孔在千差万别,所以对于这些部分的形状和结构几何描述之间的关系,可以作为面部识别中最重要的特征。
使用几何特征进行正面识别通常通过提取人眼,嘴,鼻等重要特征点位置和重要器官如眼几何作为分类特征。
基于几何特征识别方法具有较少的记忆,对光不敏感,其优点简单易懂。
这种方法也有一些问题:
(1)提取图像的稳定性特征很困难;
(2)强烈的表情变化和姿势变化不好的鲁棒性;
(3)由于某些信息丢失,适用于粗略分类。
可变形模板法可以被认为是改进的几何特征,它是一种经典的模式识别方法,这种方法主要是使用归一化互相关,直接计算两个图像之间的匹配度。
最简单的面部模板将面向椭圆形,椭圆形在检测面是图像。
另一种方式是面对一组独立的小模板,例如眼睛,鼻子,嘴巴模板模板模板,眉模板和下巴模板等。
这些模板
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 识别 算法