本科毕业论文图像识别系统的设计管理资料.docx
- 文档编号:1430227
- 上传时间:2023-05-01
- 格式:DOCX
- 页数:61
- 大小:646.84KB
本科毕业论文图像识别系统的设计管理资料.docx
《本科毕业论文图像识别系统的设计管理资料.docx》由会员分享,可在线阅读,更多相关《本科毕业论文图像识别系统的设计管理资料.docx(61页珍藏版)》请在冰点文库上搜索。
本科毕业论文图像识别系统的设计管理资料
摘要
随着计算机软硬件技术的高速发展,计算机数字图像处理技术在各个领域得到了广泛的应用,如计算机图像识别、图像检索、图像工业化应用等。
尤其是计算机识别技术,通过数字图像处理中的模式识别技术,可以将人眼无法识别的图像进行分类处理,可以快速准确的检索、匹配和识别出各种东西。
虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。
图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。
本系统使用摄像头对图像进行采集图像,~,对采集图像进行图像分割,得到二值化图像,然后通过轮廓跟踪获得图形轮廓信息,最后使用基于轮廓跟踪的图像辨别算法在空域上辨别三角形、矩形、圆形,并在特定的区域上显示相应信息。
关键词:
图形辨别角度判别轮廓跟踪
ABSTRACT
Withtherapiddevelopmentofcomputerhardwareandsoftwaretechnology,computerdigitalimageprocessingtechnologyhavebeenwidelyappliedinmanyfields,Suchasimagerecognition,imageretrieval,andimageindustrialcomputersrecognitiontechnology,bythepatternofrecognitiontechniques,itcanrecognizetheimageclassificationwhathumaneyecannotrecognize,itcanbefastandaccuratesearch,matchandidentifyallsortsofsometreatmentmethodscanalsouseopticaloranalogtechnology,buttheyarenowherenearasflexibledigitalimageprocessingandconvenience,digitalimageprocessing,andthusdigitalimageprocessingbecomethemainaspectsofimageprocessing.
Graphicdistinguishisanimportantbranchofimagerecognition,graphicdistinguishmeansgraphicimagesbyusingaspecificalgorithm,toidentifythegraphics,forexample,identifythetriangle,rectangle,round,hexagonandsoon.Thesystemusestheimagecapturecameraimagesfromthecamerascaptureimages,andthecamerratotheintheimageinrangeofthe~isProcessthecollectedimage,getthebinaryimage,andthencontourtrackingaccesstographics,theoutlinesofthefinalimage-basedcontourtrackingalgorithmtoidentifytheairspaceontheidentificationtriangle,rectangle,circle,andinparticulartodisplaythecorrespondingregioninformation.
Keywords:
graphicdistinguishanglejudgementcontourtracking
第一章绪论
1.1研究内容
图形辨别是图像识别技术中一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。
通过对采集到的图形图像进行图像预处理和图像分割,并采用轮廓跟踪法获取图形轮廓信息,最后通过角度判别实现空域图形辨别。
图像采集,采用连接摄像设备,采集图形图像;图像预处理,采用图像平滑去除或减小图像中的噪声;图像分割,将图形部分从图像中分割出来;本选题研究的空域图形辨别算法包括模板匹配法和轮廓跟踪法,模板匹配,即通过将模板和图形匹配,根据匹配结果进行图形辨别;轮廓跟踪,即根据轮廓跟踪算法获取图形轮廓信息,通过对轮廓信息进行角度辨别实现图形辨别。
其中重点研究轮廓跟踪法,主要针对三角形、矩形、圆形进行。
由于该选题的基本要求是利用C语言在MFC模块中编写相应程序,最终生成一个可执行文件,根据摄像头采取不同图像,如:
三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。
研究目的
数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像的处理技术也将会发生日新月异的变化。
在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的应用于智能交通、汽车电子、网络多媒体通信、实时监视系统、高清晰度数字电视等诸多方面。
因此,现今对该技术领域的应用研究已日趋活跃和繁荣。
而这其中的图像辨别更是有着重要的应用。
研究此课题,不仅可以明白VC++在图像处理中的应用,而且还可以明确图像辨别的重要应用意义。
实现方案
模式识别是现今使用非常广泛的图像辨别方法,基于模式识别的相关算法也很多,而且每种算法都有各自特点,要根据不同的实际图形的特点选择恰当的算法。
本设计所采用的是基于图形边缘特征的角度判别得算法,此种算法是通过对图形轮廓进行跟踪、提取边缘的特征,判断图形角度的大小,来分辨不同图像。
在系统实现过程中,研究的核心是图形辨别算法的实现,即寻找并实现一种满足系统要求的,可以分辨出三角形、矩形、圆形的图形辨别算法。
实现步骤如下:
(1)MFC中的操作界面和基本功能。
包括:
对话框程序界面,图像打开与保存,窗口控件等。
(2)VC++图像处理程序设计方面的一些算法实例。
利用VC语言进行编程实现,进行视频图像的采集,图像的预处理,图像分割,轮廓跟踪,计算轮廓夹角等内容。
(3)最终生成一个可执行文件,根据摄像头采取不同图像,如:
三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。
第二章数字图像处理知识及系统要求
数字图像处理就是利用计算机对图像信息进行加工,以满足人的视觉心理或者应用需求的行为。
实质上它是一段能够被计算机还原显示和输出为一幅图像的数字码。
当今是一个充满信息的时代,图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段。
图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。
常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。
图像处理一般指数字图像处理,虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。
以图片分析和理解为目的的分割、描述和识别将用于各种自动化的系统,如字符和图形识别、用机器人进行产品的装配和检验、自动军事目标识别和跟踪、指纹识别、X光照片和血样的自动处理等。
在这类应用中,往往需综合应用模式识别和计算机视觉等技术,图像处理更多的是作为前置处理而出现的。
随着计算机的高速发展,处理器的处理速度的提高和存储器存储容量的增大,图像处理系统的发展十分迅速,图像处理技术也得到了空前的发展和应用。
目前,图像处理技术已经广泛应用于工业、农业、医学、交通、军事等各个领域。
因此,可以说图像处理技术正逐渐成为其他科学技术领域中不可缺少的一项重要工具,它已经成为了信息技术相关领域的核心。
图像处理在各个方面都有着很重要的应用,而图像识别技术在基于图像处理的基础上可以应用于农业上,如用计算机视觉的方法进行果形识别;基于数学形态学和神经网络的方法对番茄病害果进行识别;采用机器视觉的方法辨别黄花梨果形识别;当然还可以加以改进应用于视频监控的物体辨别等等。
图像格式介绍
数字化图像数据有两种存储方式:
位图存储(Bitmap)和矢量存储(Vector)。
我们平常是以图像分辨率(即象素点)和颜色数来描述数字图象的。
1.位图方式
位图方式是将图像的每一个象素点转换为一个数据,比如:
8个象素点的数据就占据一个字节(一个字节就是8个二进制数,1个二进制数存放象素点)。
位图方式能够制作出色彩和色调变化丰富的图像,可以逼真地表现自然界的景象,同时也可以很容易地在不同软件之间交换文件,这就是位图图像的优点;而其缺点则是它无法制作真正的3D图像,并且图像缩放和旋转时会产生失真的现象,同时文件较大,对内存和硬盘空间容量的需求也较高。
2.矢量图像
矢量图像存储的是图像信息的轮廓部分,而不是图像的每一个象素点。
该存储方式的缺点是经常耗费大量的时间做一些复杂的分析演算工作,图像的显示速度较慢;但图像缩放不会失真;图像的存储空间也要小得多。
所以,矢量图比较适合存储各种图表和工程设计图。
数字图像处理中的基本图像类型
在计算机中,按照颜色和灰度的多少可以将图像分为:
二值图像、灰度图像、索引图像和真彩色RGB图像四种基本类型。
目前,大多数图像处理软件都支持这四种类型的图像。
1.二值图像
一幅二值图像的二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代白色。
由于每一像素(矩阵中每一元素)取值仅有0、1两种可能,所以计算机中二值图像的数据类型通常为1个二进制位。
二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
2.灰度图像
灰度图像矩阵元素的取值范围通常为[0,255]。
因此其数据类型一般为8位无符号整数的,这就是人们经常提到的256灰度图像。
“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。
二值图像可以看成是灰度图像的一个特例。
3.索引图像
索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称之为颜色索引矩阵MAP的二维数组。
MAP的大小由存放图像的矩阵元素值域决定,它的每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值。
索引图像一般用于存放色彩要求比较简单的图像。
4.真彩色RGB图像
RGB图像分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。
RGB图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中。
RGB图像的数据类型一般为8位无符号整形,通常用于表示和存放真彩色图像,当然也可以存放灰度图像。
1.图像增强
图像增强的主要目的有两个:
一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更利于计算机的处理,如锐化处理可突出图像边缘轮廓线,编程控制计算机进行跟踪,便可作特征分析。
2.图像分割
图像分割就是将图像分成若干有意义的区域(部分)的处理技术。
在实际图像中往往存在一些具有某种均匀一致性的区域,如灰度、纹理等分布的均匀一致性。
这种一致性构成的特征向量可用于区分图像的各个区域。
图像分割就是利用这些特征向量来检测区域的一致性,从而达到将图像分割成不同区域的目的。
3.图像编码与压缩
图像编码与压缩从本质上讲就是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息。
压缩通过编码来实现。
4.图像恢复和图像重建
图像恢复试图利用退化现象的某种先验知识,建立退化现象的数学模型,再根据模型进行反向的演算运算,恢复原来的景物图像。
与图像恢复紧密相关的是图像重建,通过一组与图像有关的物理数据建立图像的过程便是图像重建。
其中图像三维重建指利用系列平面图像信息构建这些图像所代表的三维物体。
5.图像辨别
为使人们的视觉系统认识的图像让计算机系统也能识别,必须寻找算法分析图像的特征,然后将其特征用数学的办法表示出来并教会计算机也能懂得这些特征,这样,计算机也就有了认识即识别图像的本领。
则便是机器学习,或叫模式识别。
图像分析工作的结果给出了某一具体的图像与其它图像相区别的特征。
随着计算机及通信技术的发展,图像识别在科学计算可视化、自动化、生物医学、军事侦察制导、景物理解与机器人视觉、宇宙探测遥感、虚拟实现的应用越来越来广泛。
如模式识别,已经在天气预报、卫星航空图片解释、工业产品检测、字符识别、语音识别、指纹识别、医学图像分析等许多方面得到了成功的应用。
由于我们的大脑是通过图形本身特征信息,如:
空间信息、时间信息等,它们之间的差异来辨别图形的。
这种辨别能力是依靠大脑抽象能力来实现的。
所以要使得图形识别符合我们大脑的认知相符合,造成图形识别的难度高,技术复杂,准确率较低,故应用的广泛性不高。
这也使得此方面的研究创新机会大得多,所以近年来出现很多图形辨别算法。
但是不论算法怎样改变,其本身处理的图像信息是很大的,而计算机在数据的处理能力上的优势是很明显的。
所以出现许多基于计算机的图像辨别系统。
如汽车牌照辨别系统、指纹辨识系统等。
图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。
按照图像识别从易到难,可分为三类问题。
第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。
如遥感图像中的某一像素代表地面某一位置地物的一定光谱波段的反射特性,通过它即可判别出该地物的种类。
第二类问题中,待识别物是有形的整体,二维图像信息已经足够识别该物体,如文字识别、某些具有稳定可视表面的三维体识别等。
但这类问题不像第一类问题容易表示成特征矢量,在识别过程中,应先将待识别物体正确地从图像的背景中分割出来,再设法将建立起来的图像中物体的属性图与假定模型库的属性图之间匹配。
第三类问题是由输入的二维图、要素图、2·5维图等,得出被测物体的三维表示。
这里存着如何将隐含的三维信息提取出来的问题,是当今研究的热点。
目前用于图像识别的方法主要分为决策理论和结构方法。
决策理论方法的基础是决策函数,利用它对模式向量进行分类识别,是以定时描述(如统计纹理)为基础的;结构方法的核心是将物体分解成了模式或模式基元,而不同的物体结构有不同的基元串(或称字符串),通过对未知物体利用给定的模式基元求出编码边界,得到字符串,再根据字符串判断它的属类。
这是一种依赖于符号描述被测物体之间关系的方法。
所有这些应用都是和问题的性质密切不可分的。
但是,至今还没有发展成统一的、有效的可应用于所有的模式识别的理论。
当前的一种普遍看法是不存在对所有的模式识别问题都使用的单一模型和解决识别问题的单一技术,我们所要做的是结合具体问题把统计的和句法(结构)的识别方法结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把人工神经元网络与各种以有技术以及人工智能中的专家系统,不确定方法结合起来,深入掌握各种工具的效能和应用的可能性,互相取长补短,开创模式识别应用的新局面。
而伴随这种新局面是需要相应的处理设备的资源、速度等因素的提升。
近年来,图像技术受到人们广泛的关注。
在人类接收的信息中有80%来自视觉即图像(Image)信息,这是人类最有效和最重要的信息获取、交流方式。
随着计算机的普及,人们越来越多地利用计算机帮助人类获取与处理视觉(图像)信息。
图像技术就是对视觉图像获取与加工处理技术的总称。
根据抽象程度和处理方法的不同,图像技术可分为三个层次:
图像处理、图像分析和图像理解。
这三个层次的有机结合也称为图像工程。
图像处理是较低层的操作,主要在图像象素级上进行处理。
比较狭义的图像处理主要包括对图像分割以改善视觉效果,或对图像压缩编码以减少传输时间或存储容量。
图像分析则是进入中层的操作,分割和特征提取是把原来以象素描述的图像转变成简洁的非图形形式的符号描述。
即图像分析是一个图像进而数据出的处理,数据可以是对某一特征测量所得的结果,或是基于测量的符号表示。
图像理解也经常被称为计算机视觉,主要是高层操作。
图像理解进一步研究图像中的目标和它们之间的联系,其处理过程和方法与人类的思维推理有不少类似之处。
人类很多研究都是以延伸人类能力为目的的,早期的工作是在体力上延伸,计算机发明以来,就拓展到对人类脑力和感知能力的延伸上。
对人类视觉感知能力的计算机模拟导致了计算机视觉的产生。
计算机视觉也经常被称为图像理解,是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领域。
其基本目的有三个:
(1)根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;
(2)根据一幅或多幅二维投影图像计算出观察点到目标物体的运动参数;
(3)根据一幅或多幅二维投影图像计算出观察点到目标物体的表面物理特性。
要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。
也就是利用二维投影图像来重构三维物体的可视部分。
计算机视觉研究的对象与方法
1.以模型世界为主要对象的视觉基本方法研究
这个阶段以Roberts的开创性工作为标志。
在Roberts的工作中引入了三维物体与二维成像的关系,采用了一些简单的边缘特征提取方法并引入了组合线段的方法。
这些早期的工作对视觉的发展起了促进作用,但对于稍微复杂的景物便难于奏效。
因为他对三维关系的分析仅仅是靠简单的边缘线段的约束关系,并没有充分考虑人类或其他动物视觉系统感知三维空间关系的方式。
2.以计算理论为核心的视觉模型研究
20世纪70年代开始,对计算机视觉的研究进入更为理性化的阶段,主要集中于各种本征特性的恢复,包括三维形状、运动、光源等的恢复。
主要出发点是从生理学、光学和射影几何的方法出发,研究成像及其逆问题。
在这一阶段中,以Marr为代表的一些研究者提出了以表示为核心、以算法为中间转换过程的一般性视觉处理模型。
在其理论中强调表示的重要性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又特别强调计算理论的重要性。
在三维信息的感知方面,根据人类感知深度的不同提出了一系列ShapefromX的方法。
这一阶段有代表性的工作包括:
(1)对视觉知觉现象中侧抑制现象的模拟。
主要是通过采用不同尺度的LoG算子实现对不同尺度边缘信息的感知;
(2)对双眼深度线索的分析导致对立体视觉的研究;
(3)对单眼深度线索的分析导致了ShapefromX技术的出现(这里X包括阴影、纹理、遮挡、聚焦、线条透视等);
(4)对运动物体成像过程的研究导致光流计算以及从运动恢复结构等技术的出现。
3.以应用为目标的计算机视觉方法
进入20世纪90年代之后,随着关于人工智能研究的反思,在计算机视觉的研究方面也开始考虑过去的方法是否正确,同时研究的方向开始从单纯的理论框架研究转入结合躯干运动、结合应用的研究。
在以往的研究中,生物视觉的一些重要特点没有得到足够的重视,如主动性、视觉系统中的高分辨率中央凹陷与外围视觉的结合等。
因此在80年代末、90年代初先后提出了主动视觉、定性视觉等新方法、新思路。
利用主动视觉方法使得一些本来复杂的计算得到简化,一些病态问题可以转化为良性态问题,从而得到圆满解决。
计算机视觉的应用领域
计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。
早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。
由于需要判读的照片数量很多,于是希望有自动的视觉系统进行判读解释,在这样的背景下,产生了许多航空照片和卫星照片判读系统与方法。
自动判读的进一步应用就是直接确定目标的性质,进行实时的自动分类,并与制导系统相结合。
目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末制导。
工业机器人的手眼系统是计算机视觉应用最为成功的领域之一,由于工业现场的诸多因素,如光照条件、成像方向均是可控的,因此使得问题大为简化,有利于构成实际的系统。
与工业机器人不同,对于移动机器人而言,由于它具有行为能力,于是就必须解决行为规划问题,即是对环境的了解。
随着移动式机器人的发展,越来越多地要求提供视觉能力,包括道路跟踪、回避障碍、特定目标识别等。
目前移动机器人视觉系统研究仍处于实验阶段,大多采用遥控和远视方法。
在医学上采用的图像处理技术大致包括压缩、存储、传输和自动/辅助分类判读,此外还可用于医生的辅助训练手段。
与计算机视觉相关的工作包括分类、判读和快速三维结构的重建等方面。
长期以来,地图绘制是一件耗费人力、物力和时间的工作。
以往的做法是人工测量,现在更多的是利用航测加上立体视觉中恢复三维形状的方法绘制地图,大大提高了地图绘制的效率。
同时,通用物体三维形状分析与识别一直是计算机视觉的重要研究目标,并在景物的特征提取、表示、知识的存储、检索以及匹配识别等方面都取得了一定的进展,构成了一些用于三维景物分析的系统。
近年来,基于生物特征(biometrics)的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。
与生物特征识别密切相关的另一个重要应用是用于构成智能人机接口。
现在计算机与人的交流还是机械式的,计算机无法识别用户的真实身份,除键盘、鼠标外,其他输入手段还不成熟。
利用计算机视觉技术可以使计算机检测到用户是否存在、鉴别用户身份、识别用户的体势(如点头、摇头)。
此外,这种人机交互方式还可推广到一切需要人机交互的场合,如入口安全控制、过境人员的验放等。
在计算机视觉的研究过程中,应考虑将功能模拟与认知模拟相结合。
人类延伸其他能力的过程中,功能模拟起到了主要作用,但视觉是涉及心理和生理两方面的过程,因此必须在功能模拟的同时重视认知模拟。
计算理论的进步与感知手段的改进有助于计算机视觉的研究。
在计算机视觉中计算理论占有十分重要的地位,计算理论的进步,新的计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。
采用主动视觉可从另一个侧面去处理面对的视觉问题。
要实现完整的视觉系统,视觉知识的获取、管理和利用是必不可少的。
一个相对完备的视觉系统同时也是一个知识管理系统,在视觉过程中对一幅图像的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确的显性表示,而且人类获取信息的80%是通过视觉得到的,因而这些知识涉及面之广难以预测,因此视觉系统中的知识管理是一个重要问题。
从以往的研究看,过去的40年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。
研究的重点包括对新方法、新手段的探索。
当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。
在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。
总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科毕业 论文 图像 识别 系统 设计 管理 资料