数字图像处理论文Word格式文档下载.docx
- 文档编号:4243310
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:12
- 大小:64.70KB
数字图像处理论文Word格式文档下载.docx
《数字图像处理论文Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数字图像处理论文Word格式文档下载.docx(12页珍藏版)》请在冰点文库上搜索。
摘要
图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。
本文描述了图像识别系统的结构与工作原理,图像识别的技术现状和发展趋势,以及所面临的问题,在对图像预处理、特征提取、分类、图像匹配算法进行深入研究和分析的基础上,分析和比较了各种算法的优缺点,并讨论了其中的关键技术。
关键词:
图像识别;
技术现状;
发展趋势;
关键技术
1.绪论
1.1图像识别的定义和目的
图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。
图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。
随着计算机技术与信息技术的发展,图像识别技术获得了越来越广泛的应用。
例如医疗诊断中各种医学图片的分析与识别、天气预报中的卫星云图识别、遥感图片识别、指纹识别、脸谱识别等,图像识别技术越来越多地渗透到我们的日常生活中。
[1]
1.2图像识别研究现状
图像的识别与分割是图像处理领域研究最多的课题之一,但它们依然是众多研究人员的研究重心,因为己经取得的成果远没有待解决的问题多。
图像识别的发展经历了三个阶段:
文字识别、数字图像处理与识别、物体识别。
文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设各。
数字图像处理和识别的研究开始于1965年。
数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。
物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。
它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。
现代图像识别技术的一个不足就是自适应性能差,一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。
图像识别问题的数学本质属于模式空间到类别空间的映射问题。
目前,在图像识别的发展中,主要有三种识别方法:
统计模式识别、结构模式识别、模糊模式识别。
图像分割是图像处理中的一项关键技术,自20世纪70年代,其研究已经有几十年的历史,一直都受到人们的高度重视,至今借助于各种理论提出了数以千计的分割算法,而且这方面的研究仍然在积极地进行着。
现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。
从图像的类型来分有:
灰度图像分割、彩色图像分割和纹理图像分割等。
早在1965年就有人提出了检测边缘算子,使得边缘检测产生了不少经典算法。
但在近二十年间,随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展,有关图像处理方面的研究取得了很大的进展。
图像分割方法结合了一些特定理论、方法和工具,如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等[1]。
1.3本文研究内容
2.图像处理方法概述
2.1、概述
自动图像识别系统的过程分为五部分:
图像输入、预处理、特征提取、分类和匹配,其中预处理又可分为图像分割、图像增强、二值化和细化等几个部分。
(1)图像输入
将图像采集下来输入计算机进行处理是图像识别的首要步骤。
(2)预处理
为了减少后续算法的复杂度和提高效率,图像的预处理是必不可少的。
其中背景分离是将图像区与背景分离,从而避免在没有有效信息的区域进行特征提取,加速后续处理的速度,提高图像特征提取和匹配的精度;
图像增强的目的是改善图像质量,恢复其原来的结构;
图像的二值化是将图像从灰度图像转换为二值图像;
图像细化是把清晰但不均匀的二值图像转化成线宽仅为一个像素的点线图像。
(3)特征提取
特征提取负责把能够充分表示该图像唯一性的特征用数值的形式表达出来。
尽量保留真实特征,滤除虚假特征。
(4)图像分类
在图像系统中,输入的图像要与数十上百甚至上千个图像进行匹配,为了减少搜索时间、降低计算的复杂度,需要将图像以一种精确一致的方法分配到不同的图像库中。
(5)图像匹配
图像匹配是在图像预处理和特征提取的基础上,将当前输入的测试图像特征与事先保存的模板图像特征进行比对,通过它们之间的相似程度,判断这两幅图像是否一致。
下面将从图像预处理、特征提取、图像分类及特征匹配这几个方面来讨论自动图像识别技术的研究现状和一些不足之处。
2.2、图像的预处理
预处理是图像自动识别系统中非常重要的一步,它的好坏直接影响图像识别的效果。
预处理的目的是去除图像中的噪声,把它变成一幅清晰的点线图,以便于提取正确的图像特征
2.1方向图的计算
方向图因具有真实性且能以简化的形式直观地反映图像最基本的形态特征,因此广泛应用于图像增强、图像特征的提取、图像的自动分类、方向模版匹配等图像识别的关键处理环节。
提取方向图的方法为:
(1)将图像分割成足够小的予块。
例如将图像分为16×
l6的非重叠小块。
(2)对每个子块的每一个点利用
算子分别计算其x方向梯度和y方向梯度
上式中
,
表示
;
表示各像素的灰度值。
(3)根据梯度值,每个子块方向的计算公式如下:
上式中:
表示图像块的宽度,这里是16,得到
后再将其量化为8个方向,从而得到图像的方向。
2.2图像分割
传统的图像分割方法包括灰度方差法分割和局部灰度差法等,但是这两种方法对于太湿或太干的图像分割效果往往不准确。
也有利用图像具有较强的方向性的方向图分割法,但基于方向图的分割效果依赖于所求图像的方向图的可靠性,而对图像对比度的高低并不敏感,对于单一灰度的区域,方向图分割难以取得令人满意的效果。
近几年也有学者提出了基于D-S证据理论的图像分割方法。
总之,目前用于图像分割的方法均各有利弊,采用单一特征的图像分割方法难以达到理想的分割效果。
可以把多种方法结合起来并加以改进,构造一种多级分割体系。
对于一幅图像,把它分为四类图像区域:
背景区、不可恢复区、清晰区、可恢复区。
图像分割的目的就是保持后两类区域,而去除前两类的区域。
所谓三级分割是指:
第一级分割出背景区域;
第二级从前景中分割出模糊区域;
第三级从模糊区域分割出:
不可恢复部分。
经过这样的处理不仅节省了运算时间,而且提高了分割的可靠性。
2.3图像的增强
目前用的较为广泛的是基于
滤波的增强方法和基于傅里叶滤波的低质量图像增强算法。
滤波增强的基本出发点是基于图像的数学模型,总的定义形式如下式:
要将
滤波器用于图像的处理,需要将偶
函数改变为数字滤波器,如下式所示,这样将
函数的实部作为模板得到的滤波器更真实接近图像的特征。
该方法综合考虑到了图像的方向特性和频率特性。
虽然本方法的滤波效果比较好,但是
滤波过程中频率计算和滤波计算所消耗的时间在整个图像的预处理过程中所占用的时间比重较大。
2.4二值和细化
根据图像的灰度分布,统计其最佳的阈值是二值化算法研究的核心。
传统的二值化算法有静态算法和动态算法。
动态算法比静态算法有着较好的效果,静态算法对质量差的图像区域产生大量的伪特征点,动态算法能够在一定程度上弥补静态算法的缺陷,但这样也会引入更多的噪声。
在图像二值化方面,近来又出现了一些新的方法,如一种基于方向图的动态阈值图像二值化方法。
该方法直接从图像灰度图像中获取动态阈值对图像二值化,一次性完成一般图像预处理中的分离无效区域、滤波、增强、二值化的过程。
对细化问题,国内外已提出多种细化算法,各有特点和不足,其中较具代表性的有以下几种细化算法:
经典快速细化算法、R.W.Hall细化算法、Rosenfeld细化算法、及Zhang&
Suen细化算法等。
目前使用较多的图像细化算法有两种:
基于形态学处理的快速细化算法和OPTA算法及其改进形式。
快速细化算法为4连通并行细化算法,原理是判断出图像纹线的边界点并逐步删除。
该算法速度很快,但细化不彻底,细化后的纹线不是单像素宽。
2.3、图像的特征提取和分类
直接从图像原始灰度图提取特征,效率高,但容易提取出大量的伪特征信息。
基于全局结构特征的分类方法,通过提取和分析方向图、奇异点等全局结构特征来实现分类。
采用模仿人类进行图像分类的做法,对图像的变形有较强的鲁棒性;
但图像质量较差时很难提取可靠的结构特征。
目前主流的特征提取和分类算法是基于局部细节特征的算法。
局部细节特征提取的算法如下:
利用一个3×
3的模版来对细化后的图像进行端点和分歧点的特征提取,如下图所示,M是待检测的点,沿顺时针排列的P1,P2,P3,·
·
P8是它的8个邻域点,R
(1),R
(2),R(3)·
R(8)分别是P1,P2,P3,·
P8的灰度值。
如果M是端点,则它的邻域点满足下式:
特征提取模板
如果M分支点,则它的邻域点满足下式:
通过对图像进行遍历。
可以找到图像的特征点,同时记录它们的类型和位置。
2.4、图像匹配
在图像匹配方面,很多学者进行了研究工作,但目前最常用的方法是细节匹配。
细节点模式中细节点特征向量集合和输入细节点模式中细节点特征向量集合可分别表示为:
其中模板细节点特征集合P包括M个细节点,输入细节点特征集合Q包括N个细节点。
在以上表示方法的基础上,细节点匹配问题表述为:
搜索P和Q中点之间的最佳对应关系,根据在此对应关系下相对应细节点的数目得到匹配分值MS,并与阈值T比较,如果
,则两个细节点模式匹配,如果
,则两个细节点模式不匹配。
近年来,以遗传算法和神经网络为代表的计算智能理论和技术获得了不断丰富和发展,为细节点匹配问题的求解提供了很多新的思路和工具。
如:
基于遗传算法的点模式匹配算法,该算法首先定义匹配误差,然后搜索使匹配误差最小的点对应关系,遗传算法具有搜索全局最优解的能力,因此具有较强的应用性。
3.其它图像识别方法
模糊集识别法。
在模式识别,自动控制等方面有广泛应用。
在图像识别中,有些问题极其复杂,很难用一些确定的标准做出判断。
人脑的识别精度不高,却能够用一些不够精确,也即模糊的概念准确地辨识复杂事物的特征,怎样用不太精确的方式来描述复杂的系统,怎样建立合理的数学模型来研究模糊现象,并能快速准确地进行识别,就是模糊识别法研究的目的。
标记松弛法是另一种采用符号来描述图像特征的识别方法,在这种方法中,处理对象一般称为目标,而描述目标的符号则称为标记,标记松弛法先对目标给定一组不确切的标记,通过迭代运算[3]逐次更新标记,最后求得这组目标的较为确切的标记集,算法的整个过程与人对某一事物的猜测推理过程相类似。
由于以迭代方式进行,所以易于实现,但所缺点是计算量太大[4],只有采用并行处理的方法,标记松弛法才能充分发挥它的作用。
此外,还有实用性很强的模板匹配法,模板匹配法是按照预置在机内的模板用匹配的方法来识别目标,模板可以是数字量,也可以是符号串等。
因此可以把它看作是统计法和句法方法的一种特例来研究。
模板匹配法简单方便,各种自动售货机,字符阅读机等往往按此构成,但由于噪声的影响和实际图像结构千变万化,模板匹配在较复杂的情况下往往得不到理想的效果。
4.图像识别技术所面临的问题和发展趋势
4.1、面临问题
分辨现实世界中的各种复杂景物对为类来说是一件轻而易取的事,而用计算机进行图像识别却非常困难,图像识别大多数成功的应用是相对简单(或对识别环境有严格的限制)的领域,并且多是二维的。
当前图像识别所面临者许多问题:
首先,完成一幅图像的识别要经过许多不同的处理过程,图像的识别正是这些过程的综合作用的结果。
但是缺少一个普遍的原理来指导这些过程在完成特定任务时应该如何组织和搭配,即使是对于各种常用的图像分割算法之间的性能比较,也没有一个较好的统一的标准。
还有,现在的各种图像识别算法都或多或少带有一定的局限性,图像识别是人工智能的一个重要领域。
为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。
例如模板匹配模型。
这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。
当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。
例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。
这个模型简单明了,也容易得到实际应用。
但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。
例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。
同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。
在一种环境下效果很好,但另一种环境下就可能很差,传统的只简单处理方法很难构造图像中景物的完整描述。
再次,一些能用性,效果好的算法往往计算量很大,难以实时应用。
最后,为类对生物体的视觉机理还不清楚,不能给计算机图像识别提供有力的指导。
4.2、发展趋势
前面提到的模版问题,格式塔心理学家又提出了一个原型匹配模型。
这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。
从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。
如果能找到一个相似的原型,这个图像也就被识别了。
这种模型从神经上和记忆探寻的过程上来看,都比模板匹配模型更适宜,而且还能说明对一些不规则的,但某些方面与原型相似的图像的识别。
但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。
因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。
尽管计算机图像识别技术面临着很大的挑战,但还是取得了很大的发展,多年的发展变化,不难看出一些特点:
1.立体视觉与人工智能仍然是计算机图像识别今后发展的方向,短时间内实现全自动的通用性很大的计算机视觉系统的可能性不大,今后应结合各种实际应用开发各种用途的计算机视觉系统。
2.七十年代末Marr提出的视觉计算理论极大地促进了计算机视觉的发展,但同时也存在不少缺陷,视觉识别是一个极其复杂的过程,在Marr的理论中,有些东西是作为一种假设出现的,有些重要问题甚至还没有涉及,图像识别技术的发展必须以视觉计算理论的发展为前提。
3.一些优秀的数学方法,如神经网络,模糊集,分形理论,小波分析,遗传算法纷纷应用于图像识别领域,取得了一定的成就,这些方法的继续发展完美以及各种方法相互融合,取长补短的综合集成是往后发展的重要任务。
5.总结
以上对图像识别系统的关键算法进行了讨论和比较研究。
图像识别的整个过程步骤很多,每个步骤也有若干种算法,算法的好坏直接影响后续步骤的效果。
虽然图像识别技术已取得了巨大的成就,但目前的方法对质量较差的图像的处理不太理想,算法的效率低,都是图像识别需要解决的问题,还需要注重和提高以下几个方面:
(1)由于
r变换对特征点区域的不敏感性,使得这部分的增强效果不佳,时常无法区分端点还是分支点,致使这一特征信息无效,考虑能否做出一定的改进,使得特征点类型划分的可信度更高。
此外,
变换的效率虽然随着计算机运行速度的提高而改善,但是与空域变换算法相比还有相当差距,考虑能否通过查表的方式提高
变换的运行速度。
(2)考虑利用伪特征点在数学形态学上的分布规律,对伪特征点进行删除。
(3)基于曲线结构和三角法来确定参考点的点模式匹配算法也是提高识别速度的一种方法。
总之,图像识别极富挑战性,仅仅采用一种现有方法难以取得良好的识别效果,如何提高识别率和识别速度、减少计算量、提高鲁棒性、如何实用化都是值得研究的。
参考文献
[1]杨小冬,宁新宝.自动图像识别系统图像分割算法的研究[J].南京大学学报.2004,40(4):
424—431.
[2]唐良瑞,谢晓辉.基于D-S证据理论的图像图像分割方法[J].计算机学报,2003,26(7):
887—892.
[3]李建华,马小妹.基于方向图的动态阈值图像图像二值化方法[J].大连理工大学学报.2002,42(5):
626—628.
[4]康剑莉,陈罡,毛金明.基于Cabor小波特征的磨粒图像识别新方法.激光与红外.2005.3.35(3).
章毓晋图像处理和分析基础北京高等教育出版社
[5]章毓晋图像分割北京科学出版社
[6]崔屹图像处理与分析一数学形态学方法及应用北京科学出版社
[7]杨小冬宁新宝自动图像识别系统图像分割算法的研究南京大学学报
[8]唐良瑞谢晓辉基于证据理论的图像图像分割方法计算机学报
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 论文