数字图像处理毕业论文.doc
- 文档编号:4872176
- 上传时间:2023-05-07
- 格式:DOC
- 页数:48
- 大小:964.50KB
数字图像处理毕业论文.doc
《数字图像处理毕业论文.doc》由会员分享,可在线阅读,更多相关《数字图像处理毕业论文.doc(48页珍藏版)》请在冰点文库上搜索。
目录
摘要 3
Abstract 4
第1章绪论 5
1.1自动识别课题背景 5
1.2机器视觉 5
1.2.1机器视觉的发展概况 5
1.2.2机器视觉与图像处理 7
1.3图像处理与识别技术 9
1.4图像处理与识别系统 10
1.4.1关于计算机图像处理系统 10
1.4.2图像处理与识别系统的构成 11
1.5斑马线自动识别系统课题研究内容 12
第2章图像处理与识别及图像理解 14
2.1二值图像分析 14
2.1.1阈值运算 15
2.2图像区域分析 17
2.2.1 区域与边缘 17
2.3图像处理与识别及图像理解所研究的内容 19
2.3.1图像处理技术 19
2.3.2图像识别技术 20
2.3.3图像理解 21
2.4图像处理与识别及图像理解的关系 24
2.4.1图像处理 24
2.4.2图像理解 25
2.5图像处理工具MATLAB 26
第三章 斑马线自动识别系统主要算法 28
3.1边缘检测 28
3.2坎尼(Canny)算子 29
3.3模板匹配算法 32
第4章 基于matlab的斑马线自动识别系统 35
4.1系统结构流图 35
4.2系统功能模块分析与实现 36
4.2.1图像分割模块 36
4.2.2模板读取模块 40
4.2.3图像识别模块 40
4.3GUI界面设计及系统测试 42
结论 45
致谢 47
参考文献 48
摘要
机器视觉也称图像分析与理解。
机器视觉的发展推动智能系统的发展,也拓宽计算机与各种智能机器的研究范围和应用领域。
图像处理与识别技术是机器视觉的一个重要组成部分。
图像处理与识别技术的发展经历了初创期,发展期,普及期,和实用期4个阶段。
20世纪90年代是图像技术的实用化时期,特点就是图像处理的信息量巨大,对处理速度的要求极高。
人行道路的斑马线自动识别系统的课题设计,以一幅交通道路识别为例,具体介绍了斑马线自动识别的原理。
整个处理过程分为图像预处理、图像边缘提取、图像定位、图像分割、图像识别五大模块,用MATLAB软件编程来实现每一个部分,最后识别出人行道路图像。
在研究的同时对其中出现的问题进行了具体分析。
关键词:
机器视觉图像处理自动识别预处理边缘提取图像定位图像分割图像识别
Abstract
MachinevisionisalsoImageanalysisandunderstanding.ThedevelopmentofmachinevisionpromotetheprogressofIntelligentsystem,andalsowidentheresearchandapplicationfieldofcomputerandeveryintelligentmachine.
Technologyofimageprocessingandrecognitionistheimportantcomponentofmachinevision.Theprogressofimageprocessingandrecognitionhavefourphasesthatisinitialperioddevelopmentperioduniversalperiodandpracticalperiod.Thepracticalperiodofimagetechnologyis1990s20thcentury.Thefeaturesisthattheinformationofimageprocessingtoobig,andsothat,itsprocessingspeedmustbefast.
Thecourseoftrafficsignautomatismrecognitionsystem,withonetrafficsignrecognition,theprincipleofthetrafficsignrecognitionisintroduced concretely.Thisprocesswasdividedintoimage pre-process,imageedgeextraction,imagelocation,imagedivisionandimagerecognition,whichisimplementedseparatedbyusingMATLAB.Thetrafficsignimageisrecognizedatlast.Atthesametime,theproblemsarealsoanalyzed.Andsolvedintheprocess.
Keywords:
Machinevisionimageprocessingautomatismrecognitionpre-processedgeextractionimagelocationimagedivisionimagerecognition
第1章绪论
1.1自动识别课题背景
人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性,因而发明和创造了许多机器来辅助或代替人类完成任务.智能机器,包括智能机器人,是这种机器最理想的形式,也是人类科学研究中所面临的最大挑战之一.智能机器是指这样一种系统,它能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题.人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约80%的信息是由视觉获取的.因此,对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学科—机器视觉(也称机器视觉或图像分析与理解等).机器视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域。
1.2机器视觉
1.2.1机器视觉的发展概况
70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”( MachineVision)课程,由国际著名学者B.K.P.Horn教授讲授.同时,MITAI实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的研究,DavidMarr教授就是其中的一位.他于1973年应邀在MITAI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于"积木世界"分析方法的计算视觉理论(computationalvision),该理论在80年代成为机器视觉研究领域中的一个十分重要的理论框架.
可以说,对机器视觉的全球性研究热潮是从20世纪80年代开始的,到了80年代中期,机器视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等.
到目前为止,机器视觉仍然是一个非常活跃的研究领域.许多会议论文集都反应了该领域的最新进展,比如,InternationalConferenceonComputerVisionandPatternRecognition(CVPR);InternationalConferenceonComputerVision(ICCV);InternationalConferenceonPatternRecognition(ICPR);InternationalConferenceonRoboticsandAutomation(ICRA);WorkshoponComputerVision,andnumerousconferencesofSPIE.还有许多学术期刊也包含了这一领域的最新研究成果,如,IEEETransactiononPatternAnalysisandMachineIntelligence(PAMI);ComputerVision,Graphics,andImageProcessing(CVGIP);IEEETransactiononImageProcessing;IEEETransactiononSystems,Man,andCybernetics(SMC);MachineVisionandApplications;InternationalJournalonComputerVision(IJCV);ImageandVisionComputing;andPatternRecognition.每年还出版许多研究专集、学术著作、技术报告,举行专题讨论会等.所有这些都是研究机器视觉及其应用的很好信息来源.
Marr的视觉计算理论[Marr1982]立足于计算机科学,系统地概括了心理生理学、神经生理学等方面业已取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论.Marr建立的视觉计算理论,使机器视觉研究有了一个比较明确的体系,并大大推动了机器视觉研究的发展.人们普遍认为,机器视觉这门学科的形成与Marr的视觉理论有着密切的关系.事实上,尽管20世纪70年代初期就有人使用机器视觉这个名词[Binford,1971],但正是Marr70年代末建立的视觉理论促使机器视觉这一名词的流行.
1.2.2机器视觉与图像处理
机器视觉相关的学科有许多.与机器视觉密切相关的领域及机器视觉与其它学科的关系如下.
图像处理是一个发展比较成熟的领域.图像处理技术通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成.图像处理包括图像增强、图像压缩和模糊校正与非聚焦图像等课题.机器视觉系统把图像作为输入,产生的输出为另一种形式,比如图像中物体轮廓的表示.因此,机器视觉的重点是在人的最小干预下,由计算机自动恢复场景信息.图像处理算法在机器视觉系统的早期阶段起着很大的作用,它们通常被用来增强特定信息并抑制噪声.
计算机图形学是通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(Visualization)和虚拟现实(VirtualReality)中起着很重要的作用.机器视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征.因此,计算机图形学属于图像综合,机器视觉属于图像分析.这两个领域在其发展的早期阶段是没有什么联系的,但是近十几年来发展的越来越相近了.机器视觉使用了计算机图形学中的曲线和曲面表示方法以及其它的一些技术,而计算机图形学也使用机器视觉技术,以便在计算机中建立逼真的图像模型.可视化和虚拟现实把这两个领域紧密地联系在一起.
模式识别主要用于识别各种符号、图画等平面图形.模式一般指一类事物区别于其它事物所具有的共同特征。
模式识别方法主要有统计方法和句法方法两种,统计方法是指从模式抽取一组特征值,并以划分特征空间的方法来识别每一个模式。
句法方法是指利用一组简单的子模式(模式基元)通过文法规则来描述复杂的模式。
模式识别方法是机器视觉识别物体的重要基础之一.机器视觉识别物体还经常需要其它的技术.我们将在物体识别部分简要地讨论统计模式识别的主要内容.
人工智能(artificialintelligent,AI)涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.人工智能有三个过程:
感知、认知和行动.感知把反应现实世界的信息转换成信号,并表示成符号,认知是对符号进行各种操作,行动则把符号转换成影响周围环境的信号.人工智能的许多技术在机器视觉的各个方面起着重要作用.事实上,机器视觉通常被视为人工智能的一个分支.
人工神经网络(artificialneuralnetworks,ANNs)是一种信息处理系统,它是由大量简单的处理单元(称为神经元)通过具有强度的连接(connection)相互联系起来,实现并行分布式处理(paralleldistributionprocessing,PDP).人工神经网络的最大特点是可以通过改变连接强度来调整系统,使之适应复杂的环境,实现类似人的学习、归纳和分类等功能.人工神经网络已经在许多工程技术领域得到了广泛的应用.神经网络作为一种方法和机制将用于解决机器视觉中的许多问题.
神经物理学与认知科学长期将人类视觉作为主要的研究对象.机器视觉中已有的许多方法与人类视觉极为相似.目前,许多机器视觉研究者对研究人类视觉计算模型比研究机器视觉系统更感兴趣,希望机器视觉更加自然化,更加接近生物视觉。
1.3图像处理与识别技术
图像就是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼而产生视知觉的实体。
人类从外界获得的信息约有75%来自于视角系统,也就是说,人类的大部分信息都是从图像中获得。
图像处理是人类视觉延伸的重要手段,可以使人们看到任意波长上所测得的图像。
例如,借助伽马相机,X光机,人们可以看到红外和超声图像;借助CT可看到物体内部的断层图像;借助相应工具可看到立体图像。
1964年,美国在太空拍回的大量月球照片就是使用了计算机对图像进行了处理,使原本不清晰的图像信息得以清晰再现。
这是这门技术发展的重要里程碑。
此后,图像处理技术在空间研究方面得到广泛应用。
总体来说,图像处理技术的发展经历了初创期,发展期,普及期,和实用期4个阶段。
20世纪90年代是图像技术的实用化时期,图像处理的信息量巨大,对处理速度的要求极高。
图像识别所讨论的问题,是研究用计算机代替人工自动地处理大量的物理信息,解决人类生理器官所不能识别的问题,从而部分代替人的脑力劳动。
人类识别图像的过程总是先找出它们外形或颜色的某些特征进行比较分析,判断,然后加以分门别类,即识别它们。
人们在研制自动识别机时也往往借鉴人的思维活动,采用同样的处理方法,然后图像的灰度与色彩是由光强和波长不同的光波引起,它们与景物表面的特性,方向,光线条件以及干预等多种因素有关。
在各种恶劣的工作环境中,图像与景物已有较大的差别。
因此要区分图像属于哪一类,往往要经过预处理,分割,特征抽取,分析,分类,识别等一系列过程。
现在这些技术完全可通过计算机进行模拟,对图像信息进行处理来达到对它的区别。
21世纪的图像技术要向高质量化方面发展,主要体现在以下几点:
首先高分辨率,高速度,图像处理技术发展的最终目标是要实现图像的实时处理,这在移动目标的生成,识别和跟踪上有着重要意义;其次是立体化,立体化所包括的信息最为完整和丰富,数字全息技术将有利于达到这个目的;再者是智能化,其目的是实现图像的智能生成,处理,识别和理解。
1.4图像处理与识别系统
1.4.1关于计算机图像处理系统
计算机图像处理技术是以计算机为核心的应用技术,因此,计算机图像处理系统的发展,是随着计算机技术的提高而提高的。
从系统的层次来看,可分为高、中、低3个档次;从图像传感器的敏感区域看,又可分为可见光、红外、近红外、X射线、雷达、伽玛射线、超声波等图像处理系统;从采集部件与景物的距离上来说,还可以分成遥感、宏观和微观图像处理系统;就应用场所而言,又能分成通用图像处理系统和专用图像处理系统。
通用图像处理系统一般用于研究开发,因此,要求传感器敏感区间宽,线性度好;而专用系统一般用于特殊用途,是在通用系统研究基础上,研制开发的为现实某一个或几个功能的商用系统。
因此,在保证性能的前提下,由价格因素决定系统的配置。
1、高档图像处理系统采用高速芯片设计,完全适合图像和信号处理特有规律的并行阵列图像处理机。
这类系统采用多CPU或多机结构,可以以并行或流水线方式工作。
2、中档图像处理工作站以小型机或工作站为主控计算机,加上图像处理器构成。
这类系统有较强的交互处理能力,同时,由于用通用机做主控机,因而在系统环境下,具有较好的再开发能力。
3、抵挡的微机图像处理系统由微机加上图像采集卡构成,其结构简单,是一种便于普及和推广的图像处理系统,也是本书着重介绍的系统。
1.4.2图像处理与识别系统的构成
微机图像处理系统由图像的采集部件、主机和图像的输出部件3个部分组成。
1、采集部件。
原始的图像数据是通过图像采集部件进入计算机的,因此,图像采集部件的作用是采集原始的模拟图像数据,并将模拟信号转换成数字信号。
计算机在接收到图像的数字信号后,将其存入内存。
微机图像处理系统常用的图像采集部件有摄像头加上视频图像采集卡、图像扫描仪以及数码摄像机等。
2、图像处理部件。
在微机图像处理系统中,图像处理工作是由微机完成的,微机的扩展槽上插有带帧存储器的采集卡,图像处理的过程通常包含从帧存储器读取数据到计算机内存、处理内存中的图像数据和送数据回图像帧存储器3个步骤。
对于直接使用内存的采集卡,则只需和内存进行数据交换,计算机的内存越大,CPU的运算速度越快,图像处理的速度也越快。
3、识别结果的输出部件。
图像的输出是图像处理的最终目的。
从广义的角度来讲,图像的输出形式可以分为两种:
一种是根据图像处理的结果做出判断,例如质量检测中的合格和不合格,输出不一定以图像肮作为最终形式,而只需做出提示供人或机器做出选择。
这种提示可以是计算机屏幕信息或是电平信号的高低,这样的输出往往用于成熟研究的应用上。
另一种则是以图像为输出方式,它包括中间过程的监视以及结果图像的输出。
图像输出方式有屏幕输出、打印输出和视频硬拷贝输出。
1.5斑马线自动识别系统课题研究内容
斑马线识别,最基本的就是对那些斑马线图标图片的识别,即是对图片的处理和识别,图像格式一般都是RGB等。
主要是对输入的原始RGB图像进行处理.这一过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征;这一过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等。
对一幅图像进行一系列处理之后,提取出系统要求的感兴趣区域,最后和之前做好的模板匹配比较,就得出一组相关的比较系数,从这一组系数中取出一个最大值,就可以识别出图像就是这个值指定的模板。
斑马线自动识别系统图像处理与识别包括斑马线图像的预处理,图像的分割以及图像的匹配识别。
处理识别流程如下:
斑马线图像的边缘提取、分割
斑马线图像的预处理(图像变换、增强)
输入斑马线图像
最后将图像进行匹配识别
将分割的斑马线图像进行后期处理
图1-1处理识别流程图
48
第2章图像处理与识别及图像理解
2.1二值图像分析
一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度值.实际上,图像在量化成数字图像前是一个连续强度函数的集合,场景信息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级,对某些应用来说,也常有32、64、128或512个灰度级的情况,在医疗领域里甚至使用高达4096(12bits)个灰度级.很明显,灰度级越高,图像质量越好,但所需的内存也越大.
在机器视觉研究的早期,由于内存和计算能力非常有限,而且十分昂贵,因此视觉研究人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到,人类视觉在理解仅由两个灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用场合很多.
随着计算机计算能力的不断增强和计算成本的不断下降,人们普遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统.尽管如此,二值视觉系统还是十分有用的,其原因如下:
⑴计算二值图像特性的算法非常简单,容易理解和实现,并且计算速度很快.⑵二值视觉所需的内存小,对计算设备要求低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.如若利用游程长度编码等技术。
还可使所需内存进一步减少.由于二值图像中的许多运算是逻辑运算而不是算术运算,所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图像视觉系统上.在灰度或彩色图像中,表示一个目标或物体的一种简易方法就是使用物体模板(mask),物体模板就是一幅二值图像,其中1表示目标上的点,0表示其它点.在物体从背景中分离出来后,为了进行决策,还需要求取物体的几何和拓扑特性,这些特性可以从它的二值图像计算出来.因此,尽管我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.
一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的.当使用特殊的照明技术和背景并且场景中只有少数物体时,物体可以很容易地从背景中分离出来,并可得到较好的轮廓,比如,许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.
2.1.1阈值运算
视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像划分成区域,使得每一个区域对应一个候选的物体.下面给出分割的严格定义.
定义分割是把像素聚合成区域的过程,使得:
l整幅图像(是一个完备分割).
l,(是一个完备分割).
l每个区域满足一个谓词,即区域内的所有点有某种共同的性质.
l不同区域的图像,不满足这一谓词.
正如上面所表明的,分割满足一个谓词,这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、相同纹理等谓词,但在大多数应用场合,谓词十分复杂.在图像理解过程中,分割是一个非常重要的步骤.
二值图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某一区间内,并且背景的灰度值在这一区间之外,则可以通过阈值运算得到物体的二值图像,即把区间内的点置成1,区间外的点置成0.对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件来实现,也可以通过硬件直接完成.
通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的对比度.设一幅灰度图像中物体的灰度分布在区间内,经过阈值运算后的图像为二值图像,即:
如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为:
其中Z是组成物体各部分灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出结果.
阈值算法与应用领域密切相关.事实上,某一阈值运算常常是为某一应用专门设计的,在其它应用领域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识,因此在某些场合下,前几轮运算通常采用交互式方式来分析图像,以便确定合适的阈值.但是,在机器视觉系统中,由于视觉系统的自主性能(autonomy)要求,必须进行自动阈值选择.现在已经研究出许多利用图像灰度分布和有关的物体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 毕业论文
![提示](https://static.bingdoc.com/images/bang_tan.gif)