数字图像处理与模式识别.docx
- 文档编号:16974199
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:14
- 大小:239.59KB
数字图像处理与模式识别.docx
《数字图像处理与模式识别.docx》由会员分享,可在线阅读,更多相关《数字图像处理与模式识别.docx(14页珍藏版)》请在冰点文库上搜索。
数字图像处理与模式识别
模式识别课程论文
学院;资源环境学院
专业:
12级地理信息系统
姓名:
肖笛
学号:
2012221108120009
指导老师:
魏立飞
车牌识别中的图像处理与模式识别技术
肖笛
(湖北大学资源环境学院,地理信息系统,2012221108120009)
摘要:
本文通过阐述模式识别相关理论,分析了车牌识别系统在我国研究领域的重要性,
讨论了车牌识别系统的主要功能和工作流程。
本课题在VisualC++6.0编程平台上开发了一个基于SQLServer2000数据库的集装箱编号自动识别及管理软件系统,包含编号定位、字符识别、数据库功能等三个模块。
工作流程是根据现场采集到的包含集装箱编号的图像,将编号区域检测并分割出来,经过图像增强、图像二值化、字符分割等操作,将字符图像与系统中内建的字符模板进行匹配,根据计算得到的相似度实现对字符的识别,然后将识别结果与报关单中的集装箱编号进行核对,并连接数据库,检索该集装箱相关信息,完成相应的数据库操作。
关键词:
模式识别、车牌识别、车牌定位、图像处理
Abstract:
Thispaperdescribesthetheoryofpatternrecognition,licenseplaterecognitionsystemanalyzestheimportanceofresearchinthefield,Discussesthemainfeaturesandworkflowlicenseplaterecognitionsystem.ThetopiconVisualC++6.0-basedprogrammingplatformtodevelopanumberofcontainerSQLServer2000databasemanagementsoftwareandautomaticidentificationsystems,includingtheserialnumberlocation,characterrecognition,databasefunctions,suchasthreemodules.Theworkflowiscollectedatthesceneoftheimagecontainscontainernumberandthenumberregiondetectionandsegmentationoutthroughimageenhancement,imagebinarization,charactersegmentationandotheroperations,thecharacterimageandthesystem'sbuilt-incharactertemplatematchingaccordingtothesimilaritycalculatedtoachieverecognitionofacharacter,andthentheresultswillidentifythecontainernumberandthedeclarationbechecked,andconnecttothedatabase,retrievethecontainer-relatedinformation,completetheappropriatedatabaseoperations.
Keywords:
patternrecognition,licenseplaterecognition,licenseplatelocation,imageprocessing
1.1模式识别与模式
模式识别是六十年代初迅速发展起来的一门学科。
它是指通过计算机用数学技术方法来研究模式的自动处理和判读。
我们把环境与客体统称为“模式”。
随着计算机技术的发展,人类有可能研究复杂的信息处理过程。
信息处理过程的一个重要形式是生命体对环境及客体的识别。
对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。
这是模式识别的两个重要方面。
它所研究的理论和方法在很多科学和技术领域得到了广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。
一般认为,模式是通过对其体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中的模式的总体称为模式类,其中个别具体的模式往往成为样本。
模式识别就是研究通过计算机自动的(或人为进行少量干预)将待识别的模式分配到各个模式类中的技术。
图1模式识别的基本框架
简单来说,模式识别是用于对复杂事物的分类,首先具备已知某事物的标准类别,再判断现有的事物具体属于哪一模式。
判断的过程包括对样本预处理,对其特征的提取,最后分类得出结果。
模式识别与传统的数学观点不同,它暂不去追求精确地数学模型,而是在专家经验和已有认识的基础上,从所得的大量数据和历史出发,利用数学方法来完成识别过程。
它是一门基于概念基础上的判断学科。
2.1数字图像处理、模式识别与车牌识别
数字图像处理与模式识别技术起源于20世纪20年代,经过近百年的时间洗礼,数字图像处理与模式识别技术得到迅速发展,在卫星遥感、智能交通、军事侦察、医学生物、工业自动化等应用领域中取得了巨大的成功,并且得以广泛应用。
这其中汽车牌照自动识别技术就是一个典型案例。
随着汽车数量的增加,城市交通状况日益受到人们的重视,如何进行有效的交通管理更是成为了人们关注的焦点。
针对此问题,人们运用新的科学技术,相继研制开发出了各种交通道路监视、管理系统。
这些系统通过车辆检测装置对过往的车辆实施检测,提取有关交通
数据,达到监控、管理和指挥交通的目的。
因此,智能交通系统ITS(intelligenttrafficsystem)已成为世界交通领域研究的重要课题。
近年来,车牌识别技术成为了一个热门技术,在各大中院校都有专门的课题进行研究。
车牌识别系统集成了光电、计算机、图像处理、信息识别、远程数据访问等技术,实现对监控路面过往的每一辆机动车的特征图像和车辆全景图像进行连续全天候实时记录,计算机根据所拍摄的图像进行牌照自动识别。
该系统可以应用于路桥关口,实现对过往车辆的不停车收费,还可以置于交通要塞,实现对进出车辆的不间断适时监控。
并且也可以在交通控制管理与诱导,交通流量实时检测,小区车辆自动化智能管理,高速公路的收费,车辆违章管理,车辆防盗安全,治安卡口,肇事逃逸车辆的抓获以及电子警察管理的交通违章等域都具有应用的范围,因此对其的开发与应用研究在国内外均受到了很大的关注。
但目前现实中使用的车牌自动识别系统需要较严格的条件与环境,无法应付特殊的情况,譬如夜晚,雨雾大气和复杂背景情况,故而实用性,通用性都较差。
因此急需研发一个更为完善,通用和高效准确的车辆牌照自动识别系统,进而推动智能交通系统的发展与完善。
3.1车牌识别的原理和方法
车牌识别技术主要利用每一辆汽车牌照的惟一性和互异性2个特点,将采集到的车辆图像经过一系列的处理,识别出车牌号码,按照模块设计原则。
其中包括编号定位、编号字符识别、数据库功能三个模块。
图2.车牌识别系统框图
编号定位包括预处理和车牌字符定位处理,字符识别包括倾斜度校正、字符分割和最后字符识别,得出结果进行数据库入库。
1图像预处理
在整个车牌识别系统中,由于采集进来的图像为真彩图,再加上实际采集环境的影响以及采集硬件等原因,图像质量并不高,其背景和噪声会影响字符的正确分割和识别,所以在进行车牌分割和识别处理之前,需要先对车牌图像进行图像预处理操作,包括灰度转换、灰度均衡、图像滤波等
2字符定位
主要采取图像分割的办法。
图像分割的目的就是把图像分割成一些有意义的区域,是基于特定区域的灰度分布特性与背景的灰度分布特性的差异而实现的。
在车牌识别中,需要在经过预处理的图像中把编号区域检测并分割出来。
针对字符边缘灰度变化梯度大的特点,可采用边缘检测的方法把字符和数字凸现出来。
3倾斜度校正
由于捕捉图片的摄像头与车身的角度问题,得到的车牌图片不是水平的。
为了顺利进行后续的分割和识别,必须对车牌进行角度校正。
4字符分割
二值化完成后得到的是一条上下边缘紧贴字符的二值化图像,为了最终识别字符,须将字符图像逐个分割出来,通常的办法是首先对车牌进行水平投影,去除水平边框;再对车牌进行垂直投影。
通过对车牌进行投影分析可知,与最大值峰中心对应的为车牌中第二个字符和第三个字符的间隔,与第二大峰中心距离对应的即为车牌字符的宽度,并以此为依据对车牌进行分割。
5字符识别
采用模板匹配方法来对车牌进行识别。
识别过程中,首先建立标准字库,再将分割所得到的字符进行归一化,将归一化处理后的字符与标准字库里的字符逐一比较,最后把误差最小的字符作为结果显示出来。
3.2图像预处理
3.2.1灰度化
灰度化的方法是用256色的调色板,每一项的RGB值都是相同的,也就是说RGB值从(0,0,0)到(255,255,255)。
(0,0,0)是全黑色,(255,255,255)是全白色,中间的是灰色。
这样,灰度图就可以用256色图来表示了。
如果是彩色的256色图,图像处理后可能会产生不属于这256种颜色的新颜色,所以,图像处理一般采用灰度图
在Matlab中,实现灰度化的程序语句如下:
i=imread('che.jpg');//读人原始图像
j=rgb2gray(i);//灰度化
figure,imshow(i);title’原始图像‘);
figure,imshow(j);title‘灰度图像’);
3.2.2图像增强
由于所拍摄的车辆图像质量受天气、光照和观察点等的影响,车牌图像往往会产生对比度不足的弊端,使图像细节分辨不清,影响识别率。
因此,需要将牌照图像进行图像灰度扩展,以便改善图像的观察质量,提高字符识别率。
图像增强的目的就是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合人眼观察和机器自动分析的形式。
图像增强处理的方法基本上可分为空间域处理和频率域处理两大类。
空间域处理是指在图像上直接进行数据运算,被操作者是像素的灰度级。
它又分为两类,一类是在与像素点邻域有关的空间域进行,称为局部运算。
例如,将包含某点的一个小区域内的各点灰度值进行平均计算,用所得的平均值来代替该点的灰度值,这就是通常所说得平滑处理。
另一类是对图像做逐点运算,称为点运算。
空间域法的图像增强技术可以用下式来描述:
g(x,y)=f(x,y)·h(x,y)
其中:
f(x,y)是处理前的图像;g(x,y)是处理后的图像;h(x,y)是空间运算函数。
另一方面,频域处理是指建立在修改图像傅里叶变化基础上的,就是在频域中对图像的变换值进行某种运算处理,然后变换回到空间域。
图3.频域增强模型框图
3.3二值化与字符定位
灰度图像有256个灰度级的单色图像,多级别的图像能够呈现出较为丰富的明暗度,但对于目标搜索来说,总是希望尽可能地减少背景像素的干扰而保存或增强目标区的色素度。
图像的二值化可以把像素的灰度级分成黑与白两级,即把原灰度图像转化为二值图像。
二值化算是根据待处理图像的某些特征,通过某种方法确定一个二值化阈值,从而将所需景物(待识别车辆)从背景中分离出来。
根据车牌定位的信息确定二值化阈值,将二值化与车牌定位这两个过程进行紧密结合,在车牌识别中二值化最关键的作用是能将车牌字符从车牌背景颜色中分离出来以利于车牌定位与字符分割。
经过预处理后,图片中的车牌区域已经连接成片,此时,对图片中的连通区域进行提取,并计算区域的特征参数。
根据我国现有车牌的标准尺寸(如长45cm、宽15cm)进行区域参数比较,以提取车牌区域,具体实现步骤如下。
1)粗定位
在粗定位阶段,依次进行Gauss-Laplace边缘检测,阈值二值化,连通域滤波处理,最后利用车牌区域的边缘信息进行粗定位,粗定位算法过程如下:
(1)搜索水平方向跳变数与每行字符点总数;
(2)跳变数差分,搜索车牌上下边;(3)将取间隔大于车牌高度的相邻两边为上下边候选组;(4)将过于接近的上下边组从候选车牌可能组中剔除;(5)扫描可能的车牌上下边的车牌字符垂直投影并进行邻域3列均值滤波;(6)用一个宽度为60像素,高度为候选车牌上下边距的抽样框进行垂直投影值扫描,得出左右边界;(7)利用牌宽高比的先验知识将候选组中车牌宽高比不符合一定范围内的比例关系的组进行滤除。
2)二次定位
在二次定位阶段,依次进行水平顶帽变换,去噪处理,力图将车牌的准确位置确定出来.二次定位算法过程如下:
(1)逐行扫描并统计处跳变数;
(2)对跳变数矩阵进行邻域平均,使用[-3,2,1]模板对每行跳变数进行卷积操作,再用[1,2,-3]模板对每行跳变数进行卷积操作,检测出该车牌候选组的上下边;(3)再从左往右扫描,将每列的水平跳变点数累加.然后再次从左向右扫描,将跳变数进行左右邻域均值处理,取出大于某个阈值的列为该车牌候选组的左边界,同样的方式得到右边界.
3)最终定位
最终定位是在倾斜校正后完成,它的作用是获取精确的车牌信息,力求将所有字符区域识别出来而不带来任何其他的干扰.在倾斜校正后,对其进行改进的Ots。
二值化处理最终定位过程如下:
(1)求出每行背景像素所占下行间的跳变数的差;(3)按照17x1的模板进行水平腐蚀,求出相邻两行的前景像素值的特征;(4)再次进行水平顶帽变换。
并求出上下两行的跳变数,采用[-3.2,1]与[1,2,-3]口模板进行邻域跳变数卷积操作;(5)对
(1),
(2),(3).(4)步中求得的特征值进行融合,从而求出车牌的精确上下边界;(6)扫描以车牌既定高度的1/3为宽,车牌高度为高的抽样框内的垂直投影,确定最终车牌左右边界.最终定位完毕.结果参见图4
图4车牌区域二值图
3.4倾斜度校正
由于在对车辆拍照时,摄像机角度和位置等原因,导致车牌区域会发生畸变。
这样会给后续的识别操作带来困难,所以,对产生畸变的图片我们需要对其进行修正。
目前常用的车牌图像倾斜度矫正的方法是Hough变换法,通过Hough变换求取车牌的边框,进而确定车牌的倾斜角;或者Hough变换提取牌照边框的参数后,再求解牌照区域四个顶点的坐标,然后通过双线性空间变换对畸变图像进行校正。
这种变换具有在变换空间中所希望的边缘组凝聚在一起的特性。
假设我们希望检测一条直线上的边缘。
直线的一般方程写成:
xcosθ+ysinθ=γ(3-1)
其中θ是该直线的法线与x轴之间的夹角,Y是该法线的长度(见图3-1)。
在该直线上的任何边缘点(xi,yi)必须满足
xicosθ+yisinθ=γ(3-2)
式(3-2)可以解释为在(γ,θ)空间中的一条正弦曲线(如图3-2所示),并看成是点(xi,yi)在(γ,θ)空间中的Hough变换,在这条变换曲线上的任何点都和一条通过(xi,yi)点的线相对应。
如果许多点在(x.y)空间共线,则它们的Hough变换曲线必须在(γ,θ)空间中相交于一点。
为了用数字化来实现,必须对(γ,θ)空间进行量化。
每个边缘点(xi,yi)对于由式(3-2)给出的若干单元的计数产生影响,有最高计数的单元给出所希望的线。
图5.一个点的hough变换
传统的Hough变换对整幅图像的每一个像素进行计算,以求出图像中可能存在的直线。
这样计算量大,不能满足实时要求。
本课题采用改进的Hough变换进行倾斜度的校正,改进的方法是只对集装箱编号上下边界可能存在的部分点集进行计算,从而大大减少了计算量。
步骤如下:
1.对编号图像进行二值化。
设列号i=0;
2.在图像第i列从上往下扫描,找到第一个值为“1”的点(xi,yi);
3.i=i+1,重复步骤2,直到i等于字符图像宽度W*.
这样对宽度为W*的编号图像只有W*个点。
设定一组直线方程:
y=px+q(3-3)
其中p为斜率,q为截距。
在倾角(-20°,20°)范围内对W*个点应用Hough变换。
根据参数空间累加数组的值,求出该点集中共线点最多的子点集,该子集所代表的直线的斜率p1作为上边界的斜率。
同理可求出下边界的斜率pz。
若p1与p2相差很小,则求其平均值p,否则,在参数空间另外选择子点集,以使p1,p2尽量一致,并求其平均值。
根据求得的编号的倾斜度p,即可对编号图像进行准确校正。
图6.倾斜度校正
3.5字符分割
车牌上的字符第一个是汉字,其余的字符都是数字和字母,在理想的状态下数字和字母都是连通域,而汉字也可以利用其位置和大小信息进行连通域合并,本文使用了连通域的方法进行字符分割.但是实际情况下分割出来的车牌图像会有很多噪声,严重影响了字符的分割。
根据车牌特征信息对其做了如下改进:
①排除尺寸大小或长宽比例不符合车牌字符特征的连通域,滤除大部分噪声点的干扰;②确定车牌字符精确的起始行与结束行位置,排除车牌安装螺钉对第
二和第六个字符的干扰;
③针对字符之间的粘连、字符笔划本身的断裂,根据已分割出来字符所表现出的位置信息微调二值化闭值,重新局部二值化;
④充分利用车牌字符的位置和顺序信息,查找连通域漏检的字符,排除干扰区域.由于充分考虑了车牌字符的位置信息和干扰信息,并通过重新局部二值化消除字符粘连,本算法对条件较差的车牌仍具有较强的适应能力和较高的正确分割率.
字符分割后得到的字符尺寸大小会由于环境等因素影响而有所变化,必须先对字符大小进行归一化处理,运用图像的缩放算法将每个字符都归一化为24x48点阵,使其与字符样本库中的字符样本大小相同.然后根据每个待识别字符的位置与不同字符样本库进行比较.字符样本库中的字符与待识别字符比较,具有最大相似度的字符即为待识别字符的识别结果.对一些容易误判的字符(如Q和0、B和8等)再进行细化处理,利用其细化后骨架形状的不同做出准确的判断,从而提高识别率。
图7.字符分割
3.6字符识别
用于字符识别的模式识别方法大致分为结构模式识别和统计模式识别两种。
统计模式识别理论发展较早,也比较成熟。
应用于字符识别领域时,其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决。
统计特征的特点是抗干扰能力强,匹配与分类的算法简单,易于实现。
不足之处在于细分能力较弱,区分相似字的能力差。
这一方法是目前字符识别研究领域的主要方法
本文采用了多种统计模式识别综合法。
首先采用了模板匹配的方法,计算字符与模板中最为相似的即为识别结果.匹配过程的数学描述为
由于模板匹配对相似的字符之间的识别率很差,如“8”和“B”,“0”和“Q”,”5”和“S“,”Z”和“2“等。
仔细比对这些相似的车牌字符可以发现,虽然从形状上很难区分这些相似字,但是英文字符的4个角通常与数字有着很大的不同。
利用这一点,本系统使用4个角的小区域相似度来对模板匹配进行修正.整个识别过程如下:
(1)利用上述计算公式算出车牌字符与每一个模板的相似百分比;
(2)同时计算车牌字符与每个模板的4个角的相似度,将加权后的角相似度加上相似百分比作为判定依据,将最大的相似百分比作为识别结果。
4.1数据库功能模块
数据库管理系统(DBMS)由一个相互关联的数据的集合和一组用以访问这些数据的程序组成,这个数据集合通常称作数据库。
建立车牌数据库就是关系数据库。
系统得到识别结果
后,与需要核实的车牌编号进行核对,并连接数据库,检索该车牌相关信息,完成相应的数据库操作。
系统取得编号识别结果后,自动连接数据库,查询信息表,如没有该项记录,证明识别结果有误,需要重新识别;如查到相关记录,再查询基本信息表,如基本信息表中有记录,可以与车牌进行比较,确定真伪,如没有该车牌基本信息,经确认后可以添加。
数据库还可以其他查询功能,如查询某日车牌所属车经过路段,或者显示车牌车主信息。
我们采用SQL语言作为查询语言。
完整的数据库操纵语言不仅包括查询语言,还包括对数据库进行修改的语言。
5.1结论与展望
本文详细论述了车辆牌照定位检测技术的主要应用领域和现阶段的发展情况,着重对车牌自动定位算法和图像处理算法的设计和实现进行了详细分析和介绍。
图像处理算法能够有效的改善图像质量,提高车牌的识别率,最大程度的减小漏检、误检能情况,为车牌定位工作打下一个良好的基础。
以MATLAB为开发工具,运用SQL语言,结合模式识别、计算机图形学和图像处理的知识,对车牌识别进行了讨论。
可以看出车牌识别系统在当前的交通管理方面有很大的作用,一方面有利于堵车问题的管制,例如北京提出的单双号限行制度,利用车牌识别与交警的人机结合工作可以提高管制力度,达到更好的效果;另一方面,对违章违规车辆的查找,交通事故逃逸、刑事案件的破解都有一定的帮助。
参考文献
[1]李晶皎等(译),模式识别(第四版),电子工业出版社,2009;
[2]郁梅,基于视觉的车辆牌照检测,计算机应用研究.1995(5);
[3]孙家广,计算机图形学(第三版),清华大学出版社,1998;
[4]容观澳,计算机图像处理,北京,清华大学出版社,2002;
[5]向荣,周慧娟,一种基于数字图像处理的精确车牌识别系统,武汉理工大学学报,2013
(1);
[6]王晓雪,苏杏丽,数字图像处理在车牌识别中的应用,2010(37);
[7]骆雪超等,一种基于车牌特征信息的车牌识别方法,华南理工大学学报,2003(31)
[8]杨冬青,唐世渭(译).数据库系统概念.北京:
机械工业出版社.2002
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 模式识别
![提示](https://static.bingdoc.com/images/bang_tan.gif)