基于形状特征的图像检索系统的设计与实现.docx
- 文档编号:17266673
- 上传时间:2023-07-23
- 格式:DOCX
- 页数:183
- 大小:327.83KB
基于形状特征的图像检索系统的设计与实现.docx
《基于形状特征的图像检索系统的设计与实现.docx》由会员分享,可在线阅读,更多相关《基于形状特征的图像检索系统的设计与实现.docx(183页珍藏版)》请在冰点文库上搜索。
基于形状特征的图像检索系统的设计与实现
毕业论文声明
本人郑重声明:
1.此毕业论文是本人在指导教师指导下独立进行研究取得的成果。
除了特别加以标注地方外,本文不包含他人或其它机构已经发表或撰写过的研究成果。
对本文研究做出重要贡献的个人与集体均已在文中作了明确标明。
本人完全意识到本声明的法律结果由本人承担。
2.本人完全了解学校、学院有关保留、使用学位论文的规定,同意学校与学院保留并向国家有关部门或机构送交此论文的复印件和电子版,允许此文被查阅和借阅。
本人授权大学学院可以将此文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本文。
3.若在大学学院毕业论文审查小组复审中,发现本文有抄袭,一切后果均由本人承担,与毕业论文指导老师无关。
4.本人所呈交的毕业论文,是在指导老师的指导下独立进行研究所取得的成果。
论文中凡引用他人已经发布或未发表的成果、数据、观点等,均已明确注明出处。
论文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究成果做出重要贡献的个人和集体,均已在论文中已明确的方式标明。
学位论文作者(签名):
年月
关于毕业论文使用授权的声明
本人在指导老师的指导下所完成的论文及相关的资料(包括图纸、实验记录、原始数据、实物照片、图片、录音带、设计手稿等),知识产权归属华北电力大学。
本人完全了解大学有关保存,使用毕业论文的规定。
同意学校保存或向国家有关部门或机构送交论文的纸质版或电子版,允许论文被查阅或借阅。
本人授权大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存或编汇本毕业论文。
如果发表相关成果,一定征得指导教师同意,且第一署名单位为大学。
本人毕业后使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为大学。
本人完全了解大学关于收集、保存、使用学位论文的规定,同意如下各项内容:
按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、数字化或其它手段保存或汇编本学位论文;学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入学校有关数据库和收录到《中国学位论文全文数据库》进行信息服务。
在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。
论文作者签名:
日期:
指导教师签名:
日期:
基于形状特征的图像检索系统的设计与实现
摘 要
近年来,随着多媒体和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。
面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。
因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。
为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生[6]。
本文主要研究基于形状特征的图像检索,边缘检测是基于形状特征的一种检索方法,边缘是图像最基本的特性。
在图像边缘检测中,微分算子可以提取出图像的细节信息,景物边缘是细节信息中最具有描述景物特征的部分,也是图像分析中的一个不可或缺的部分。
本文详细地分析了一种边缘检测方法Canny算子,用C++编程实现各算子的边缘检测,并根据边缘检测的有效性和定位的可靠性,得出Canny算子具备有最优边缘检测所需的特性。
并通过基于轮廓的描述方法,傅里叶描述符对图像的形状特征进行描述并存入数据库中。
对行相应的检索功能。
关键词:
图像检索;形状特征;Canny算子;边缘检测;傅里叶描述符
DesignandImplementationofImageRetrievalSystemBasedonShapeFeatures
ABSTRACT
Withtherapiddevelopmentofmultimediaandcomputernetworktechnique,thequantityofdigitalimageandvideoisgoingupfabulously.Facingthevastoceanofinformationofimage,ithasagoodsensetoobtainthedesiredmultimediainformation.Currently,rapidandeffectivesearchingfordesiredimagefromlarge-scaleimagedatabasesbecomesanhotresearchtopic.
Inordertoretrieveimagequicklyandaccuratelyusingimagevisualfeaturessuchascolor,texture,shape,whichnamedcontent-basedimageretrieval(CBIR)cameintobeing.Thispaperintroducestheprincipleofwavelettransformapplyingtoimageedgedetection.Edgedetectionisbasedontheshapeofthecharacteristicsofaretrievalmethod,andtheedgeisthemostbasiccharacteristicsoftheimage.Intheimageedgedetection,differentialoperatorcanbeusedtoextractthedetailsoftheimages,features’edgeisthemostdetailedinformationdescribingthecharacteristicsofthefeaturesoftheimageanalysis,andisalsoanintegralpartoftheimage.ThispaperanalyzesaCannyoperatoredgedetectionmethod,andwecompletewiththeC++languageproceduretocometureedgedetection.Accordingtotheeffectivenessoftheimagedetectionandthereliabilityoftheorientation,wecandeducedthattheCannyoperatorhavethecharacteristicswhichtheimageedgehas.Andcontour-basedmethodfordescribingtheimageFourierdescriptorstodescribetheshapefeatureandstoredinthedatabase.Alignthecorrespondingsearchfunction.
Keywords:
imageretrieval;sharpfeature;Cannyoperator;edgedetection;Fouriershapedescriptors
目 录
1前言1
1.1 课题背景及研究意义1
1.2 国内外发展状况1
1.3 课题研究的主要内容2
2基于形状特征的图像检索3
2.1 图像检索技术的发展过程3
2.1.1 基于内容的图像检索技术3
2.1.2 基于形状特征的图像检索3
2.2 边缘检测4
2.3 Canny边缘检测4
2.3.1 Canny指标4
2.3.2 Canny算子的实现5
2.4 基于轮廓的描述方法7
2.4.1 傅立叶形状描述符7
2.5 图像的相似性度量9
3 基于形状特征的图像检索系统的设计10
3.1 Canny算子的程序设计10
3.2 图像特征数据库设计11
3.3 实验结果12
4 基于形状特征的图像检索系统实现13
4.1 系统框架13
4.2 编程环境14
4.3 程序结果14
5 总结15
参考文献16
致 谢17
附 录18
1前言
1.1课题背景及研究意义
随着多媒体技术、计算机技术、通信技术及Intemet网络的迅速发展,人们正在快速地进入一个信息化社会。
现代技术已能运用各种手段大量的采集和产生各种类型的多媒体数据,人们对多媒体信息的需求也越来越大量和频繁。
虽然信息的快速增长促进了社会的发展,但是信息膨胀也给人类带来了过多信息量以至于超过了人的接受能力。
因此,除了获取、处理和存储多媒体信息十分重要,怎样在海量的多媒体信息中快速有效地访问人们感兴趣的多媒体信息也显示出了同样的重要性。
图像信息是多媒体信息中最常见的一种,也具有多媒体信息数据量大、抽象程度低的特点。
如何从海量的图像信息中有效地获取有用信息,即图像信息资源的管理和检索显得日益重要。
随着人们对图像信息的巨大需求的增长,产生了基于文本的图像检索技术,比如著名的搜索引擎XX中对图像的检索。
这种基于文本的检索技术所利用的人工标注方法存在局限性,经常检索出来大量的用户不感兴趣的图像,[5]但在没有更好解决办法的情况下,用户只能继续使用。
因此如何对图像的内容自动、客观、全面地进行特征提取。
真实有效的表示图像内容,帮助用户快速有效地访问感兴趣的图像有着极大的研究需求和迫切的需要,而基于内容的图像检索(ContentBasedmageRetrieval,CBIR)技术恰好能有效的解决这个问题。
另外在实际的应用中,图像数据库及其检索的研究对多媒体数字图书馆、医学图像管理、卫星遥感图像和计算机辅助设计和制造、地理信息系统、犯罪识别系统、商标版权的管理,生物的辨识分类等方面提供有力的支持。
1.2国内外发展状况
近年来,CBIR已经成为一个非常活跃的研究领域,各国科研机构与公司已陆续推出了一些CBIR系统的产品,有的已经成功应用到医学、商标、专利检索等领域。
IBM的QBIC(QueryByImageContent)是第一个商业性的CBIR系统。
它提供了基于颜色、纹理、形状和手绘草图的图像索引方法。
Columbia大学的VisualSEEK提供了基于色彩和纹理的索引方法。
PhotoBook是麻省理工学院(MIT)媒体实验室开发的一套检索、浏览图像的交互式工具,它包含三个子系统分别提取形状、纹理和人脸特征,【4】用户可以分别做基于上述一种特征的检索。
MARS(multimediaanalysisandretrievalsystem)系统由美国UIUC大学开发,其不同之处在于用到了很多领域的知识:
计算机视觉、数据库管理系统和信息检索。
新加坡国立大学开发的一个基于内容的图像检索系统,其显著技术特色包括:
多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。
清华大学的ImgRetr结合了多种组织方法,就能提供基于主色、纹理、直方图、颜色分布、框架等多种方式的检索。
1.3课题研究的主要内容
本文依托基于内容的图像检索技术,重点研究基于形状特征的图像检索。
形状特征不同于颜色、纹理特征,形状特征的表达必须以对图像中物体或区域的划分为基础。
在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,通常情况下.形状特征有两类表示方法,一类是区域特征,利用的是整个形状区域;另一类是轮廓特征,利用的则是图像的外边界。
本文主要研究的就是外边界的索引方法边缘检测,边缘检测的方法有很多,如:
Roberts交叉微分算子、Sobel微分算子、Priwitt微分算子和Laplacian微分算子以及Canny算子。
而其中属Canny算子最好。
对图像特征进行描述有很多种方法,链码、曲率尺度空间、TAR描述符、傅立叶描述符、小波描述符、边界矩等。
本文主要研究的是傅里叶描述符。
其主要思想是用物体边界的傅立叶变换作为其形状描述。
2基于形状特征的图像检索
2.1图像检索技术的发展过程
图像检索技术始于上个世纪70年代,当时主要是基于文本的检索,即使用关键词和描述性文本进行检索,要求用户对文本特征的描述具有一定的准确性和规范性。
但是随着大规模数字图像库的出现,基于文本的检索技术暴露出自身的缺点。
进入90年代,基于内容的图像检索技术应运而生,其思路是利用图像自身的视觉特征,如:
颜色、纹理结构、形状、空间关系作为图像的内容进行匹配、查找。
它通过利用已有的算法,使得特征提取和匹配完全可以由机器自动完成,检索过程不需要太多的人为干预和解释,这就克服了手工注释的低效和二义性。
2.1.1基于内容的图像检索技术
目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。
近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。
在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。
一些科研部门、高等院校、商业公司以至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。
目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur开发出的基于图像内容的相似性特征的图像库检索引擎,并在网上提供了演示站点。
国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。
目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。
除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索。
总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。
2.1.2基于形状特征的图像检索
由于许多图像检索系统都把重点放在基于颜色或者纹理的方法上。
但是对于某些图像来说,纹理和颜色信息不够丰富,如一些商标图像等,这时基于颜色和纹理的方法就无法满足检索需要,而必须从图像的形状着手。
形状特征是图像的核心特征之一,图像的形状信息不随图像颜色的变化而变化,是物体的稳定特征。
用形状特征区别物体非常直观,是人们分类不同图像的主要特征之一。
因此,利用形状特征检索图像可以提高检索的准确性和效率。
基于形状特征的图像检索主要是检测出目标的轮廓线或分割出目标的轮廓,并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征。
形状描述应该在尽可能区别不同目标的基础上对目标的平移、旋转和尺度变化不敏感。
目前,虽然已经提出了许多形状分析方法,但要将其有效地运用于图像检索上还有一些问题亟待解决,如算法的效率和复杂性,形状特征的提取与描述等。
2.2边缘检测
边缘是图像的最重要的特征。
边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。
Poggio在文中说:
“或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质它能大大地减少所要处理的信息但是又保留了图像中物体的形状信息”。
边缘检测是图像识别的基础和前提,直接决定了图像识别结果的正确性。
由于边缘检测还不成熟,直接影响了图像识别的应用,一直是图像识别领域的一个研究热点。
经过多年的研究,边缘检测已经渗透到各个应用领域。
在医学上,边缘检测用于肾小球的提取,在工业和工程方面的应用在工业和工程领域中,用于纤维制品的检测,在。
喷漆、焊接、装配中也得到了有效的利用。
在文化艺术上,用于纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等。
总之,边缘检测已经应用于各个领域。
是我们不可忽视的一项研究热点。
2.3Canny边缘检测
2.3.1Canny指标
基于微分算子的边缘提取存在的一个比较麻烦的的问题就是如何选择合适的阈值,可以使边缘从细节当中提取出来。
阈值的选择不同,所提取出的边界信息就不同。
在两个不同的阈值下,采用同样的微分算子均可以提取出图像的边缘,但是两者有比较大的区别。
这样,在边缘提取中就存在着对提取好坏的评价。
针对这一问题,根据边缘检测的有效性和定位的可靠性,Canny研究了最优边缘检测器所需的特性,给出了评价边缘检测性能优劣的三个指标:
(1)好的信噪比,即将非边缘点判为边缘点的概率要低,将边缘点判为非边缘点的概率要低;
(2)好的定位性能,即检测出的边缘点要尽可能在实际边缘的中心;
(3)对单一边缘仅有惟一响应,即单个边缘产生多个响应的概率要低,并且虚假响应边界应得到最大的抑制。
用一句话说,就是希望在提高对景物边缘的敏感性的同时,可以抑制噪声的方法才是好的边缘提取方法。
值得庆幸的是,且个线性算子可以在抵抗噪声与边缘检测之间获得一个最佳的折中,这个算子就是高斯函数的一阶导数。
高斯函数与原图的卷积达到了抵抗噪声的作用,而求导数,则是检测景物边缘的手段。
对于阶跃形的边缘,Canny推导出的最优边缘检测器的形状与高斯函数和一阶导数类似,因此Canny边缘检测器就是由高斯函数的一阶导数构成的。
我们知道,高斯函数是圆对称的,因此Canny算子在边缘方向上是对称的,在垂直于边缘的方向上是反对称的。
这就意味着该算子对最急剧的变化方向上的边缘特别敏感,但在沿边缘方向上是不敏感的。
设二维高斯函数为
(2-1)
其中,σ是高斯函数的分布参数,可用以控制对图像的平滑程度。
最优阶跃边缘检测算子是以卷积▽G*
为基础的,边缘强度为
,而边缘方向为
。
从高斯函数的定义可知,该函数是无限拖尾的,在实际中,一般情况下是将原始模板截断到有限尺寸N。
实验表明,当
时,能够获得较好的边缘检测结果。
2.3.2Canny算子的实现
下面是Canny算子的具体实现。
利用高斯函数的可分性,将▽G的两个滤波卷积模板分解为两个一维的行列滤波器:
(2-2)
其中
(2-3)
(2-4)
(2-5)
(2-6)
(2-7)
(2-8)
K为常数将式(2-2)(2-3)分别与图像
(2-9)
则
反应了图像上
点处的边缘强度,
是图像的点
处的法向矢量(下交于边缘方向的方向)。
根据Canny的定义,中心边缘点为算子
与图像
(x,y)的卷积在边缘梯度方向上的区域中的最大值。
这样,就可以在每一点的梯度方向上判断此点强度是否为其领域的最大值来确定该点是否为边缘点。
当一个像素满足以下三个条件时,则被认为是图像的边缘点。
(1)该点的边缘强度大于沿该点梯度方向的两个相邻像素点的边缘强度;
(2)与该点梯度方向上相邻两点的方向差小于45度;
(3)以该点为中心的
领域中的边缘强度极大值小于某个阈值。
此外,如果
(1)和
(2)同时被满足,那么在梯度方向上的两相邻像素就从候选边缘点中取消,条件(3)相当于区域梯度最大值组成的阈值图像与边缘点进行匹配,这一过程消除了许多虚假的边缘点。
图像边缘检测的基本步骤:
(1)滤波,边缘检测主要基于导数计算,但受噪声的影响。
但滤波器在降低噪声的同时也导致了边缘强度的损失。
(2)增强,增强算法将邻域咴度有显著变化的点突出显示。
一般通过计算梯度幅值完成。
(3)检测,但在有些图像中梯度幅值较大的并不是边缘点。
最简单的边缘检测是梯度幅值阈值的判定。
(4)定位,精确确定边缘的位置。
综上所述,Canny算子的具体算法步骤如下:
(1)用高斯滤波器对图像进行滤波,去除图像中的噪声;
(2)用高斯算子的一阶微分对图像进行滤波,得到每个图像的梯度强度和方向;
(3)对梯度进行“非极大抑制”梯度的方向可以被定义为如图2-1所示
标识为1,2,3,4的属于四个区之一,各个区用不同的邻近像素来进行比较,以决定局部极大值。
例如,如果中心像素x的梯度方向属于第4区,则把x的梯度值与它左上和右下相邻像素的梯度值比较,看x的梯度值是否是极大值。
如果不是,就把像素x的灰度设为0。
这个过程称为“非极大抑制”。
4
3
2
1
x
1
2
3
4
图2-1梯度方向图
(4)对梯度取两次阈值,即取阈值
,两者关系为
。
我们把梯度值小于
的像素的灰度设为0,得到图像1。
然后把梯度值小于
的像素的灰度设为0,得到图像2。
由于图像2的阈值较高,去除大部分噪声,但同时也损失了有用的边边缘缘信息。
而图像1的阈值较低,保留了较多的信息。
我们以图像2为基础,以图像1为补充来连接图像的边缘。
(5)链接边缘的具体步骤如下:
1.对图像2进行扫描,当遇到一个非零灰度的像素P时,跟踪以P为开始点的轮廓线,直到轮廓线的终点Q。
2.考察图像1中与图像2中Q点位置对应的点
的8邻近区域。
如果在
点的8邻近区域中有非零像素
存在,则将其包括到图像2中,作为R点。
从R开始重复第一步,直到我们在图像1和图像2中都无法继续为止。
3.当完成对包含P的轮廓线的连接之后,将这条轮廓线标记为已仿问。
回到第①步,寻找下一条轮廓线,重复第
(1)步第
(2)步第(3)步,直到图像2中找不到打新轮廓线为止。
至此完成Canny算子的边缘检测。
2.4基于轮廓的描述方法
基于轮廓的形状描述方法也分为连续型(即全局型)和离散型(即结构型)两种类型。
连续型的描述方法不对轮廓进行分段处理,往往是从全局轮廓抽取特征矢量。
离散型的方法往往首先将轮廓划分为很多片段,然后提取相应的特征。
简单的形状描述符主要有链码、傅立叶描述符、曲率尺度空间描述符及小波描述符四种基于轮廓的描述方法。
2.4.1傅立叶形状描述符
傅立叶形状描述符(Fouriershapedescriptors)是一种广泛应用的形状描述符,其基本思想是用物体边界的傅立叶变换作为其形状描述,假设一个二维物体的轮廓是由一系列坐标为
的像素组成,其中
,而N是轮廓上像素的总数。
从这些边界点的坐标中可以推导出四种形状表达,分别是曲率函数、质心距离、复坐标函数和弦长函数。
轮廓线上某一点的曲率定义为轮廓切向角度相对于弧长的变化率。
曲率函数
可以表示为:
(2-10)
其中
是轮廓线的切向角度,定义为:
(2-11)
质心距离定义为从物体边界点到物体中心
的距离,如下所示:
(2-12)
复坐标函数是用复数表示的像素坐标:
(2-13)
这种复坐标函数的傅立叶变换会产生一系列复数系数。
这些系数在频率上表示了物体形状,其中低频分量表示形状的宏观属性,高频分量表达了形状的细节特征。
形状描述符可以从这些变换参数中得出。
为了保持旋转无关性,我们仅仅保留了参数的大小信息,而省去了相位信息。
缩放的无关性是通过将参数的大小除以DC分量(或第一个非零参数)的大小来保证的。
请注意变换无关性是基于轮廓的形状表示所固有的特点。
对于曲率函数和质心距离函数,我们只考虑正频率的坐标轴,因为这时函数的傅立叶变换是对称的,即有
。
基于曲率函数的形状描述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 形状 特征 图像 检索系统 设计 实现