人脸区域分割.docx
- 文档编号:18120152
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:11
- 大小:720.84KB
人脸区域分割.docx
《人脸区域分割.docx》由会员分享,可在线阅读,更多相关《人脸区域分割.docx(11页珍藏版)》请在冰点文库上搜索。
人脸区域分割
第三章人脸区域分割
3.1引言
第二章中比较详细的介绍了本次毕业设计中使用的肤色模型,并分析了这种肤色模型的适应性和实用性,给出了实验验证的结果。
本章将介绍人脸区域分割的算法。
在肤色模型确定的情况下,人脸区域分割的算法在肤色分割预处理中起到核心性的作用。
结合引言中总结的肤色区域分割预处理的目标,我们可以将人脸区域分割算法的整体过程用下面的系统结构示意图来表示:
输入输出
图3-1
在上面的示意图中,输出的一系列矩形就将取代原来的整幅图像作为后面的人脸检测算法的输入。
所以对于这些矩形的要求如下:
(1)这一系列矩形应该尽可能的包含待检测图像中的所有人脸。
对于距离较近或者是有接触的多个人脸,分割后得到的肤色区域自然距离较近或者是连在一起,这时可以用一个矩形区域覆盖它们。
根据引言中对肤色分割预处理的分析可知,不漏检、不降低正确率是整个肤色分割预处理的前提,也自然是人脸区域分割算法的首要前提。
在加上第二章中对肤色模型的分析,无论什么样的肤色模型都存在着判断失误的现象,所以这第一点要求——即算法输出的一系列矩形应该尽量包含所有的人脸区域——便显得尤为重要。
(2)这一系列矩形应该少包含非肤色区域,也即相对原来的整幅图像,经过肤色分割预处理后的这一系列矩形的大小要明显小于原来的整幅图像。
这也正是肤色分割预处理能够提高人脸检测算法的时间效率的原因;也是肤色分割预处理能够降低误报率的关键。
3.2本论文中使用的人脸区域分割算法
根据上面对于肤色区域分割算法结果的要求,也就是对于算法本身的要求,我们这里提出了一种新颖、快捷、鲁棒的人脸区域分割算法。
在第一章引言中,我们对物体分割方法的概述中总结了三大类方法:
基于象素的方法,基于边界的方法和基于区域的方法。
我们前面的利用肤色模型的肤色象素点的提取相当于已经应用了基于象素的方法。
而在此基础上我们要将这一个个分散的肤色象素点构成一个个人脸区域,再用这些人脸区域的外接矩形来表征它们。
对于其他的两种方法,我们可以简单的分析一下它们各自的优缺点。
基于边界的方法由于处理的象素数量相对较少,各象素点间的相邻关系也相对简单,所以处理起来的速度要比基于区域的方法快;但另一方面,由于基于边界的方法是从局部特性来求图像整体的分割,因此在全局宏观性质的考虑上不如基于区域的方法。
综合上面对基于边界的方法和基于区域的方法各自优缺点的比较上,我们应该力求两者能够取长补短,所以在这一部分中我们采用了将基于边界的方法和基于区域的方法相结合的算法:
基于边界的方法主要用于前期初始矩形序列的产生,争取快速的得到包含人脸区域的外接矩形;然后用基于区域的方法,全局考虑,对初始矩形序列进行区域归并,得到最终的输出矩形。
首先对于算法的整体流程,我们用一个图来表示:
图3-2
下面,我们将就构成整个算法的各个主要步骤进行详细论述。
并将以图3-3中的一幅含有9个人脸的图像为例,跟踪每一步的处理。
图3-3
图3-4为经过第二章叙述的肤色分割算法处理后的肤色分割结果:
图3-4
3.2.1去噪声处理
在完全没有先验知识的情况下,对于一些独立的肤色象素点,想将它们归为一个个人脸区域,我们很自然的会想到找连通区的方法。
属于同一个人脸区域的肤色象素点应该是相互连通的;反之,一个人脸区域也应该是由一些连通的肤色象素点构成的。
但由于噪声普遍存在于数字图像中;还有基于肤色模型的分割结果存在判断失误的情况,都会在连通的人脸区域中产生非肤色的噪声。
所以进行人脸区域分割之前要进行去噪声或者称为滤波的处理。
在这里我们采用了基于象素“密度”的滤波方法来去除噪声。
这是一种类似“卷积”的滤波方法。
直观的讲,就是在以每一个肤色象素为中心的5*5邻域内统计肤色象素的个数,超过半数时中心点保留为肤色,否则认为是非肤色。
对我们的例子,即图3-4中的肤色分割结果进行这种滤波后得到的结果为:
图3-5
3.2.2提取边界、对边界的连通关系作处理并由边界的连通性和闭合性得到初始的一系列矩形
在得到了是否是肤色的相当于是二值化的图像以后,我们就可以提取出每一个人脸区域的边界了。
为提高人脸区域提取算法的速度,我们设计了快速的肤色区域边界提取算法:
即扫描图像一遍,将与非肤色象素点相邻的肤色象素点提取出来作为肤色区域的边界。
显而易见,经过了肤色分割以及去噪声处理后的图像提取出来的边界都是各自闭合的,也即每一段边界都是首尾相接的,各自包围着一个一个的连通的肤色区域。
由上面所述的边界提取算法得到的肤色区域边界,是遵循四连通原则的。
这一点我们可以从下面的简化示意图中直观的看出。
(a)(b)(c)
图3-6
图3-6中的(a)是肤色分割的结果,并对局部放大得到的,(b)是我们上面叙述的方法提取到的边界。
显然这样的边界上点和点之间的相邻关系是遵循四连通原则的,即在以一个象素点为中心的3*3邻域内,按照上、下、左、右四个方向来跟踪边界。
我们直观的称这种边界为“原始四连通边界”。
但是,我们后边的寻找初始的人脸区域外接矩形的算法是基于边界的,所以边界点数目越少越有利于提高算法性能。
而且过多的冗余的边界点也会给我们基于边界找外接矩形的方法带来更多的可能的失误情况,例如过于接近的边界点会导致不应该出现的小矩形的出现;2*2的小正方形中的四个象素点如果都是边界点就会使我们的边界跟踪失败。
所以我们将上面的“原始四连通边界”转化为“简化四连通边界”,即将“原始四连通边界”上的象素点再进行一步处理,抛弃不与肤色象素点相邻的边界点。
这样一来,冗余的边界点被减少,边界相邻关系也更加简单,这样我们利用四连通原则来判断边界的连通和闭合关系,就会减少失误和跟踪失败的现象。
得到了“简化四连通边界”以后,我们就可以由边界的连通性和闭合性来找每一段边界的外接矩形。
基于如下几条论据,我们可以知道由“简化四连通边界”得到的外接矩形可以找到人脸区域的外接矩形。
(1)如果找到的“简化四连通边界”是闭合的,则显然闭合区域的外接矩形就是肤色区域的外接矩形。
当然闭合的“简化四连通边界”内部还可能存在闭合或者不闭合的“简化四连通边界”,也就是说可能还存在连通的非肤色区域,但考虑到我们的预处理前提是尽可能的包括肤色即人脸区域,所以在没有其他先验知识的情况下,我们当然应该将这样的肤色区域用一个矩形包围起来,参加后面的人脸检测。
另外,在前面对肤色模型的分析中我们也清楚的看到,由于高光等的影响,人脸的额头、颧骨等处经常被误检为不是肤色,而周围的一个环状区域被误检的可能性就小的多,所以更应该将这种肤色区域中间包围非肤色区域的情况用一个大的外接矩形包围起来参加后面的人脸检测,才能保证不漏检。
(2)由于噪声和边界提取并不完全精确等因素的影响,找到的“简化四连通边界”也并不一定都是闭合的。
但即使这样,每一个连通的肤色区域的边界也一定是由一些不闭合的“简化四连通边界”段组成,这些边界段各自的外接矩形一定是相互接触或有重叠的,我们在后面的区域归并算法中将对这样的情况进行处理,用这些矩形的公共外接矩形来包围整个区域,显然这样得到的一个公共矩形也是原肤色区域应有的、正确的外接矩形。
图3-7举出了一个简单的例子说明这种情况。
图3-7
下面就是由边界的连通性和闭合性得到初始的一系列矩形的具体算法:
算法3.1提取人脸区域外接矩形的算法:
(1)给每一个边界点增加一个标志域:
“边界跟踪的起始点”、“已检测过的边界点”、“未检测过的边界点”。
(2)在图像中的边界点中从下到上、从左到右寻找一个未检测过的边界点,即标志域为“未检测过的边界点”的点。
如果找得到,将其标志域改为“边界跟踪的起始点”,为这一新的跟踪建立一个外接矩形,初始化其上、下、左、右四个边界,进入(3)的处理;否则转(7)。
(1)从这一“边界跟踪的起始点”开始,按照四连通的原则,在其上、下、
左、右的四个邻接点中寻找“未检测过的边界点”,因为不存在孤立的边界点,所以这一点一定能找到,将其标志域改为“已检测过的边界点”,并将其作为当前操作点,转(4)。
(2)从当前操作点开始,按照四连通的原则,在其上、下、左、右的四个
邻接点中寻找“未检测过的边界点”或“边界跟踪的起始点”。
如果找到,转(5);否则转(6)。
(3)如果新找到的点是“未检测过的边界点”,则将其标志域改为“已检
测过的边界点”,将其作为当前操作点,再转回(4)。
如果新找到的点是“边界跟踪的起始点”,要判断这一点与当前操作点是否“互相找到对方”,如果是,仍以原来那个当前操作点开始,转回(4);如果不是,将“边界跟踪的起始点”的标志域改为“已检测过的边界点”,并转(6)。
(4)将
(2)中建立的外接矩形的四个边界值确定,并转
(2)寻找新的人
脸区域。
(7)整个图像中的人脸区域寻找完毕,得到了一系列外接矩形。
在算法中每找到一个新的“未检测过的边界点”就判断其坐标值能否改变外接矩形四个边的位置,这样所有的边界点找完,外接矩形也就自然确定了下来。
图3-8是例子中的图像经过处理得到的初始的矩形序列,我们用不同的伪彩色来区别不同的矩形。
图3-8
3.2.3将初始的矩形序列进行归并处理
前面分析过,基于边界的人脸区域分割方法有着快速、便捷的优点,但它是从局部特性出发,没有考虑图像整体因素,所以会造成得到的初始的矩形序列中的矩形相互覆盖、重叠等现象,所以要对这一初始矩形序列进行归并处理。
特别是上面一节中分析了,可能出现一个封闭的肤色连通区的边界被跟踪成了几小段的情况,所以这一步的归并处理也显得必不可少。
具体的归并原则如下:
(1)当一个矩形完全包围另一个矩形时,抛弃内部的矩形。
(2)当两个矩形的边界接触或两个矩形出现重叠现象时,用这两个矩形公共的外接矩形来代替这两个矩形。
(3)后面的人脸检测算法可以让用户交互式的设定人脸可能的最小尺寸,当用户不进行设定时我们也默认人脸的最小尺寸为20*20。
所以,经过以上两步归并得到的矩形,如果其尺寸小于这一最小尺寸,我们也将其抛弃。
经过这样的归并处理以后,我们就得到了最终的输出矩形。
也即肤色分割处理的最终结果。
示例图像的处理结果如下:
图3-9
3.3对于这种人脸区域分割算法有效性的实验验证
为了验证上面的人脸区域分割算法的有效性,我们在一个更广大的实验集中
进行了测试。
这个实验集共包括319个图像,其中包括人脸数为3173个。
我们实验验证的重点在于人脸区域分割算法是否能尽可能多的包含人脸,尽量不丢失人脸。
实验结果表明我们算法的输出,即下一步将要参与人脸检测算法的矩形序列中共包含了3018个人脸,命中率可以达到95.115%。
可见,这种肤色分割预处理是有效的,可以加以利用。
图3-9是我们这一章中一直使用的例子在使用了我们上面介绍的肤色区域分割预处理后,经过人脸检测的最终结果:
图3-10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区域 分割