基于模板匹配算法的数字识别教材文档格式.docx
- 文档编号:3654023
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:21
- 大小:373.08KB
基于模板匹配算法的数字识别教材文档格式.docx
《基于模板匹配算法的数字识别教材文档格式.docx》由会员分享,可在线阅读,更多相关《基于模板匹配算法的数字识别教材文档格式.docx(21页珍藏版)》请在冰点文库上搜索。
1.1研究目的和意义2
1.2国内外研究现状2
2本文基本理论介绍3
2.1位图格式介绍3
2.2二值化3
2.3去噪3
2.4细化4
2.5提取骨架4
3图像的预处理5
3.1位图读取5
3.2二值化及去噪声5
3.3提取骨架6
4基于模板匹配的字符识别8
4.1样本训练8
4.2特征提取8
4.3模板匹配9
4.4加权特征模板匹配10
4.5实验流程与结果10
5结论16
5.1小结16
5.2不足16
6参考文献17
基于模板匹配算法的数字识别
摘要
数字识别已经广泛的应用到日常生活中,典型的数字自动识别系统由图像采集、预处理、二值化、字符定位、字符分割和字符识别等几部分组成,这些过程存在着紧密的联系。
传统的模板匹配算法因为图像在预处理之后可能仍然存在较大的干扰,数字笔画粗细不均匀,有较大的噪声,识别效率不高。
本文采的主要思想就是对字符进行分类,之后对字符进行细化,提取细化后字符的特征矢量,与模板的特征矢量进行加权匹配,误差最小的作为识别结果。
本文在模板匹配法的基础上,采用了特征值加权模板匹配法,并且改进了匹配系数的求法。
应用该法取得了满意的效果,提高了识别率。
关键词:
模板匹配;
数字识别;
特征值加权;
字符识别;
Templatematchingalgorithm-baseddigitalidentification
Abstract
Digitalidentificationhasbeenwidelyappliedtodailylife,thetypicaldigitalautomaticidentificationsystembytheimageacquisition,pre-processing,binarization,characterpositioning,charactersegmentationandcharacterrecognitionseveralparts,thereisacloselinktheseprocesses.Traditionaltemplatematchingalgorithmbecausetheimagemaystillexistafterpre-greaterinterference,digitalstrokesuneventhickness,thenoise,theidentificationefficiencyisnothigh.Adoptedhereinmainideaistoclassifythecharacteraftercharacterrefinement,thecharactersfeaturevectorextractionrefinement,andthetemplatefeaturevectorisweightedmatching,theminimumerrorasarecognitionresult.Templatematchingmethodbasedonfeatureweightedtemplatematchingmethod,andimprovethematchingcoefficientmethod.Theapplicationofthemethodtoobtainsatisfactoryresults,toimprovetherecognitionrate.
Keywords:
Templatematching;
digitalidentification;
characteristicvalueweighted;
characterrecognition;
1绪论
1.1研究目的和意义
字符是我们进行信息交流的重要工具,实现计算机的手写字符识别是加快社会信息化进程的关键所在.由于阿拉伯数字是唯一的被世界各国通用的符号,手写字符识别的研究一直以阿拉伯数字为主导.在识别算法方面,目前常用的字符识别方法有模板匹配法、几何分类法、人工神经网络识别法和支持向量机(SVM)识别法.从原理上分析,模板匹配法实现较为简单,但常用的模板匹配法在模板数量很大时计算量很大.本文将研究对象局限于特定图像数字,采用模板匹配法进行识别,根据数字特征先找出最佳特征值,再进行识别取得了较好的效果.下面是实验中涉及的有关算法.
1.2国内外研究现状
图像匹配在近几十年来一直是人们研究的热点和难点,最早的研究是在70年代美国从事飞行器辅助导航系统等军事应用研究中提出来的。
经历了10多年的发展从年代以后其应用逐步从原来单纯的军事应用扩大到其它领域。
国内外现阶段对图像匹配研究主要是以提高匹配的精度和速度为主,同时对匹配方法的通用性及鲁棒性也有一定要求。
已研究比较多的匹配方法主要分为基于图像灰度的匹配方法和基于图像特征的匹配方法。
基于灰度相关的图像匹配方法,主要处理不存在旋转的匹配对象,且已经提出了各种各样针对灰度匹配的方法,如:
Leese与1971年提出的MAD算法,BameaDI和Silverman和于1972年提出了序贯相似性检测法——SSDA,紧接着又提出了归一化积相关算法——NCC,这些方法在时问复杂度或匹配精度上均存在一定问题,不适应于实际的匹配应用。
对各种匹配快速算法的研究,主要是从尽可能减少匹配运算量或搜索的位置数这两个角度入手。
文献[1]分别对MAS、NCC和SSDA等经典模板匹配算法进行改进以提高匹配速度;
文献[2]提出新的匹配方法,即基于图像灰度值编码的匹配方法,较传统匹配算法在速度上提高了一个数量级,但其仅适应于矩形匹配对象,且对局部光照变化非常敏感,从而影响匹配准确度。
但在实际应用当中,一般以不规则匹配对象居多,且环境的光照变化也是非常不稳定因素,因此算法设计过程中必须考虑这几个因素。
典型的还有在搜索策略上进行改进的一系列方法,分层搜索技术、遗传算法、最小二乘、模拟退火、能量最小、削减搜索分支、多子区域相关匹配等。
匹配速度主要从两个方面来分析,一方面分析在同样硬件环境下,同样匹配精度和要求下,比较所研究方法和其它方法的实际运算时间;
另一方面分析算法,进行算法时间复杂度的比较。
由于基于灰度相关的图像匹配方法,不能解决匹配对象存在旋转情况下的匹配问题,所以继续研究基于特征的图像匹配方法,主要是针对匹配对象存在旋转情况下的匹配方法。
常使用的特征包括边缘、区域、曲率、面积、线交叉点、质心等,其中以边缘和区域边界最常用,它们可由边缘检测方法和图像分割方法得到。
从上述分析可知,一方面匹配问题是研究热点,另一方面也说明匹配问题仍然有许多技术难题没有解决且急需解决。
在上千种算法中,匹配问题在准确性、鲁棒性两方面几乎找不到通用的、一劳永逸的算法。
2本文基本理论介绍
2.1位图格式介绍
本文位图格式是BMP格式。
BMP是一种与硬件设备无关的图像文件格式,使用非常广。
它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BblP文件所占用的空间很大。
BMP文件的图像深度可选lbit、4bit、8bit及24bit。
BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。
典型的BMP图像文件由三部分组成:
位图文件头数据结构,它包含BMP图像文件的类型、显示内容等信息;
位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息。
2.2二值化
图像二值化(binaryimage),就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。
将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。
在数字图像处理中,二值图像占有非常重要的地位,首先,图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。
其次,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像。
所有灰度大于或等于阀值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。
2.3去噪
图像在生成和传输过程中常常因受到各种噪声的干扰和影响而使图像降质,这对后续图像的处理(如分割、压缩和图像理解等)将产生不利影响。
噪声种类很多,如:
电噪声、机械噪声、信道噪声和其他噪声。
在图像处理中,图像去噪是一个永恒的主题,为了抑制噪声,改善图像质量,便于更高层次的处理,必须对图像进行去噪预处理。
本文是根据噪声能量一般集中于高频而图像频谱则分布于一个有限区间的这一特点,采用低通滤波方式来进行去噪。
低通滤波是频率域滤波的一种,频率域滤波是将图像从空间或时间域转换到频率域,再利用变换系数反映某些图像特征的性质进行图像滤波的方法。
傅立叶变换是一种常用的变换。
在傅立叶变换域,频谱的直流分量正比于图像的平均亮度,噪声对应于频率较高的区域,图像实体位于频率较低的区域。
图像在变换具有的这些内在特性可被用于图像滤波。
可以构造一个低通滤波器,使低频分量顺利通过而有效地阻于高频分量,即可滤除图像的噪声,再经过反变换来取得平滑的图像。
2.4细化
图像处理中物体的形状信息是十分重要的,为了便于描述和抽取图像特定区域的特征,对那些表示物体的区域通常需要采用细化算法处理,得到与原来物体区域形状近似的由简单的弧或曲线组成的图形,这些细线处于物体的中轴附近,这就是所谓的图像的细化。
通俗的说图像细化就是从原来的图像中去掉一些点,但仍要保持目标区域的原来形状,通过细化操作可以将一个物体细化为一条单像素宽的线,从而图形化的显示出其拓补性质。
2.5提取骨架
实际上,图像细化就是保持原图的骨架。
所谓骨架,可以理解为图象的中轴,例如一个长方形的骨架是它的长方向上的中轴线;
正方形的骨架是它的中心点;
圆的骨架是它的圆心,直线的骨架是它自身,孤立点的骨架也是自身。
对于任意形状的区域,细化实质上是腐蚀操作的变体,细化过程中要根据每个像素点的八个相邻点的情况来判断该点是否可以剔除或保留。
3
图像的预处理
首先在模板匹配之前要对图像进行预处理,去除图像中的噪声,对图像进行细化,提取其骨架
3.1位图读取
位图是一种应用非常广泛的图像格式,所以在图像处理时也通常将模拟图像转化成位图的形式。
数字图像处理的基本方法有中值滤波、灰度值计算、图像分割、孤点滤波等。
但是在作这些工作之前,首先也是最基本的必须正确的读取位图,在此基础上实现图像的平移、旋转、滚动,满足图像处理对图像的要求。
对于位图的读取和图像平移、旋转等基本操作已经不再是新鲜话题。
本文采取的方法是利用已有的API函数实现位图的读取,运用计算机图形学知识实现对位图的基本操作
3.2二值化及去噪声
本文采用的是自适应阈值二值化方法,使用迭代法求出灰度阀值,高于该阀值灰度设为255,低于该阀值灰度设为0
迭代法是基于逼近的思想,其步骤如下:
(1)求出图象的最大灰度值和最小灰度值,分别记为Rmax和Rmin,令阈值
=(Rmax+Rmin)/2。
(2)根据阈值
将图象的平均灰度值分成两组R1和R2。
(3)分别求出两组的平均灰度值μ1和μ2。
(4)求出新阈值
=(μ1+μ2)/2。
是二值化后输出的图像,通过阀值(设为
)来二值化图像的公式为
公式3-1
其效果如图3-1,图3-2
图3-1(待识别字符图片)
图3-2(二值化图片)
再对二值化的图像进行去噪,本文采用低通滤波来进行。
低通的数学表达式如下式所示:
(3-2)
式中
一含有噪声的原图像的傅立叶变换;
一为传递函数,也称转移函数(即低通滤波器);
一为经低通滤波后输出图像的傅立叶变换。
H滤波滤去高频成分,而低频信息基本无损失地通过。
滤波后,经傅立叶变换反变换可得平滑图像。
3.3提取骨架
细化即将二值化的数字图像按一定的规律缩小到成单像素点构成,但保持源图像的结构特征。
细化算法依据是否使用迭代运算可以分为两类:
第一类是非迭代算法,一次即产生骨架,如基于距离变换的方法,游程长度编码细化等。
第二类是迭代算法,即重复删除图像边缘满足一定条件的像素,最终得到单像素宽带骨架。
迭代方法依据其检查像素的方法又可以再分成串行算法和并行算法,在串行算法中,是否删除像素在每次迭代的执行中是固定顺序的,它不仅取决于前次迭代的结果,也取决于本次迭代中已处理过像素点分布情况,而在并行算法中,像素点删除与否与像素值图像中的顺序无关,仅取决于前次迭代的结果。
在细化一幅图像X时应满足两个条件:
第一,在细化的过程中,X应该有规律地缩小;
第二,在X逐步缩小的过程中,应当使X的连通性质保持不变。
对设已知目标点标记为1,背景点标记为0。
边界点是指本身标记为1而其8连通邻域中至少有一个标记为0的点。
本文采用串行的迭代算法对一幅图像的所有边界点即一个3×
3区域都进行如下检验和操作:
考虑以边界点为中心的8邻域,设p1为中心点,对其邻域的8个点逆时针绕中心点分别标记为p2,p3,…,p9,其中p2位于p1的上方。
如果p1=1(即黑点)时,下面4个条件同时满足,则删除p1(p1=0):
①2≤N(p1)≤6,其中N(p1)是p1的非零邻点的个数;
②S(p1)=1,其中S(p1)是以p2,p3,p4,…,p9为序时这些点的值从0到1变化的次数;
③p2p4p6=0或者S(p1)≠1;
④p4p6p8=0或者S(p1)≠1。
P3
P2
P9
P4
P1
P8
P5
P6
P7
图3-3(9像素图)
(1)同第
(1)步,仅将③中的条件改为p2p4p8=0,④中的条件改为p2p6p8=0。
同样当对所有边界点都检验完毕后,将所有满足条件的点删除。
以上两步操作构成一次迭代。
(2)算法反复迭代,直至没有点再满足标记删除的条件,这时剩下的点就组成区域的骨架。
图表3-3所示的8个模板反应了图像的边缘像素点分布特点
图3-4边界点像素点分布
对图表3-2的图像进行细化提取骨架后得到的细化图片如图表3-3
图3-5骨架图
4
基于模板匹配的字符识别
将预处理完成的灰度二值化图片按模板匹配的方法识别出来,将图片信息转化为数字信息,供后续使用,下文将介绍模板匹配算法的原理
4.1样本训练
本文在在建立标准的字符模板库时需要手动将样本输入,建立临时标准的字符模板库,然后保存,这就需要在之前已经有模板样本,进行必要的样本训练。
样本训练的过程也是提取样本图像字符的特征值的过程,方便之后匹配时使用。
4.2特征提取
特征提取的目的是从原数字图像文件中抽取出能用于区分其与其他字符不同类型的本质特征,对研究对象本质的,固有的重要特征和属性进行量测并将结果数值化,形成特征矢量,对图像的识别,学习过程都要非常重要。
能描述对象本质特征的元素有很多,但是为了节约资源,有时更是为了可行性,在保证分类识别正确率的前提下,尽量选择识别作用较大的特征,使得用较少的特征就能完成分类识别任务,有一种简单的方法就是减少特征矢量的维数或符号字符数,本文中采用对待识别数字图像进行行列扫描与数字起点结合的方法提取特征。
结构特征提取的算法如下:
1)对细化后的数字图像取竖直的三条直线,分别取在5/12,1/2,7/12处,记下这三条竖直直线与数字笔段的交点数。
2)再取水平三条直线,分别取在1/3,1/2,2/3处,分别记下这三条水平直线与数字笔段的交点数。
3)再取对角两条直线,分别记下这两条对角直线与数字笔段的交点数。
如图表4-1所示
图4-1待识别字符特征提取
经细化后的数字图像其特征较为稳定,且笔划简单,因此对其抽取的基本结构组件能反映数字的本质特征,从而可快速有效地识别数字符号,并达到较好的分类效果。
提取笔划特征的算法如下:
1)按从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点P;
2)计算像素P的8———领域之和N;
3)若N=1,则像素P为端点,端点计数器加1;
4)重复步骤
(1)-(3),直到遍历整个图像。
依据上述特征提取方法,本系统中的特征矢量由9个分量组成,其排列如下所示:
DATA=[水平1/3处交点数,水平中线交点数,水平2/3处交点数,竖直5/12处交点数,竖直中线交点数,竖直7/12处交点数,左对角线交点数,右对角线交点数,端点数]
图4-2模板特征提取
4.3模板匹配
获取一组少而精的分类特征是特征提取的目的,即获取一组分类错误概率小而且特征数目少的特征向量。
在此识别算法应用之前,要求已存在一个在之前就学习的基础上建立起的标准的字符模板库,这个模板库是一个树状结构,它是根据每个模板中的矢量线段数和交叉矢量线段数而建立的,里面主要存储着标准字符的特征表。
该算法将需要识别字符的特征表与已建立的模板库中的标准字符的特征表逐个比较,如果发现标准模板库中某一字符的特征表与之相匹配时,则判断该被其识别的字符为该标准字符。
如果在模板库中没有一个能与该被识别字符的特征表相匹配的标准字符存在,则系统会显示拒识的信息。
如果该字符被据识,可以把被拒识的字符的特征表当作另外的标准模板加入到模板库中去,并记录该特征表与字符匹配关系,方便以后再遇到具有这种特征的字符的识别。
模板匹配是字符识别的基本方法之一。
其数学描述为:
(4-1)
式中,
为两个字符的欧氏距离,
(m,n)为待识别样本,
(m,n)为知识库中的模板,在识别开始时,要求分别计算待识别图像与标准模板库中的每个模板的距离,标准模板库中一共有10个数字,则只需与10个数字逐个比较,
越小,表示此待识别样本与标准模板的匹配程度越好,为零则说明两者完全匹配,这种方法虽然最简单,而且容易实现,但该算法的计算量会随着图像所含像素增加而快速增加,而且执行匹配运算次数随着原图的增大而增多,匹配效率不高。
为此,我们提出采用提取特征矢量来进行数字识别。
4.4加权特征模板匹配
在实际数字特征提取过程中,有些数字外形存在很大的相似性,可能会造成不同的数字提取的9个特征矢量的区别不大,比如,6和0,3和5等,为了提高算法识别数字的正确率,拉大各数字特征矢量间的区别,本文提出另一种改进的算法,该算法在提取了字符的9个特征的基础上,再根据某些特征矢量的重要程度,对9个特征进行加权匹配,这样使得数字识别的准确率大大提高。
依据上面提取出的特征矢量,进行模板匹配,其数学描述如下:
(4-2)
为第k个特征的权值,
与
分别为模板库中某个模板与待匹配字符的第k个特征,
为匹配值,表示匹配字符的特征与模板字符的特征的差异程度,匹配值越小,两个字符特征越一致。
其中,加权系数需要不断的实验来确定,以达到较好的分类效果。
算法描述如下:
设i=0,j=0;
1)取第i个字符与模板库中的第j个模板进行比较;
2)比较第1,4,6个特征,
取值为2;
比较第2,5,9个特征,
取值为0.5,比较第3,7,8个特征,
取值为1。
“j++”,如果全部模板匹配完毕,进入步骤(3)执行,否则回到步骤
(1)执行。
3)取出最小的模板匹配值,以该模板字符作为与当前字符匹配成功的字符。
“i++,j=0”,回到步骤
(1)执行。
4.5实验流程与结果
实验操作流程图如下:
标准字符图示意:
图4-3标准字符
待识别样本示意图:
图4-4待识别样本(数字0)
图4-5待识别样本(数字9)
图4-3实验流程图
为验证该算法的可行性,本实验采用了270张数字图片进行实验,用VisualC++6.0编程,在Inter(R)Core(TM)i3-2350M2.3GHz4.00G内存的微机上进行仿真,整体识别率达到94%,识别时间0.5S,满足实际应用要求。
以数字6为例,数字6在形态上和数字0相似,基本模板匹配识别结果为0,如图2-4所示,通过加权匹配,拉大了类间距离,正确识别为6,流程如下:
样本训练阶段:
图4-4样本训练
图4-5样本训练
样本识别阶段:
算法改进前将6错误识别为0
图4-6错误识别
改进算法后,正确识别为6
图4-7识别正确
5
结论
5.1小结
本文通过将数字图像进行二值化,是图像处理更加方便,便于图像的识别,进而对数字图像进行细化操作,以提高系统的运算速度,然后分析数字图像的特点,提取图像的特征矢量,在基本模板匹配的识别的基础上,对某些特殊而重要的特征矢量进行加权,然后再匹配,提高了系统正确的识别率。
实验结果表明,两者的结合使系统有较高的识别正确率与识别速度,达到了预期的效果。
5.2不足
虽然本文采取特征值加权算法使识别率大大提高,但是本文在图像二值化和提取骨架过程中使用迭代算法,在去噪声过程中使用傅里叶变换,这样使得算法在时间复杂度上有些不足,在今后的研究中,要在这几处深入研究,找到一个更优化的算法。
6
参考文献
[1]姜凯,陈海霞,汤建华.一种快速图像匹配算法的设计与实现.计算机工程与应用,2004
[2]李强,张钹.一种基于图像灰度的快速匹配算法.软件工程报,2006
[3]马驷良,马洪波,董险峰.数字图像的一种快速细化方法.吉林大学自然科学学报,2001.10
[4]匿名.图像去噪处理毕业论文.XX文库,2006
[5]崔政,李壮.两种改进的模板匹配识别算法.计算机工程与设计,2006.03
[6]邹明明,卢迪.基于改进模板匹配的车牌字符识别算法实现.哈尔滨理工大学电气学院,2010.01
[7]刘洋洋,嵇启春.一种改进的模板匹配的数字识别算法.西安建筑科技大学信息与控制工程学院,2006
[8]吴小艳,王维庆,杨春祥,何山,王小龙.几种基于模板匹配法的数字图像识别算法分析.XX文库,2006
[9]张志,田凯,李文秀.数字图像处理中位图读取和基本操作.哈尔滨工程大学自动化学院,2002
[13]刘静,周静华,苏俊连,付佳.基于模板匹配的车牌字符识别算法实现.河北工程大学信电学院通信与信息工程系,2004(04)
[14]李新良.基于模板匹配法的字符识别算法研究.湖南娄底职业技术学,2012(02)
[15]张志,田凯,李文秀.数字图像处理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 模板 匹配 算法 数字 识别 教材