彩色图像分割方法综述.pdf
- 文档编号:14654343
- 上传时间:2023-06-25
- 格式:PDF
- 页数:19
- 大小:1.19MB
彩色图像分割方法综述.pdf
《彩色图像分割方法综述.pdf》由会员分享,可在线阅读,更多相关《彩色图像分割方法综述.pdf(19页珍藏版)》请在冰点文库上搜索。
第10卷第1期2005年1月中国图象图形学报JournalofImageandGraphicsV0110No1Jan,2005彩色图像分割方法综述林开颜”吴军辉”徐立鸿2(同济大学现代农业科学与工程研究院,上海200092)2(同济大学控制科学与工程系,上海200092)摘要由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。
彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种彩色图像分割方法有较全面的了解,因此对各种彩色图像分割方法进行了系统论述,即先对各种颜色空间进行简单介绍,然后对直方图阈值法、特征空间聚类、基于区域的方法、边缘检测、模糊方法、神经元网络、基于物理模型方法等主要的彩色图像分割技术进行综述,并比较了它们的优缺点,通过比较发现模糊技术由于能很好地表达和处理不确定性问题,因此在彩色图像分割领域会有更广阔的应用前景。
关键词彩色图像分割颜色空间直方图阈值化边缘检测模糊方法神经网络中图法分类号:
TP39141文献标识码:
A文章编号:
10068961(2005)01-000110ASurveyonColorImageSegmentationTechniquesLINKaiyan”,WUJunhui”,XULihon91(ModernAgriculturalScience&EngineeringInstituteofTongjiUniversity,Shanghai200092)2(ControlScience&EngineeringDepartmentofTongiiUniversity,Shanghai200092)AbstractDuetocolorimageprovidingmoreinformationthanmonochromeimage,colorimageprocessingisbeingpaidmoreandmoreattentionImagesegmentationiscriticaltoimageprocessingandpatternrecognitionSOallthetypicalapproachesarepresentedanddiscussedinthispaperBasically,colorimagesegmentationtechniquesarebasedonmonochromeonesoperatingindifferentcolorspacesThispaperfirstreviewedsomemajorcolorrepresentationmethods,thensummarizedthemajorcolorimagesegmentationapproachesincludinghistogramthresholding,characteristicfeatureclustering,regionbasedapproaches,edgedetection,fuzzytechniques,neuralnetworks,physicsbasedmethodThemeritsanddrawbacksofthemethodswerediscussedtooFuzzysettheoryprovidesamechanismtopresentandmanipulateuncertaintyandambiguity,whichisdesirableforimageprocessingSo,thefuzzyapproacheswillhaveapromisingapplicationinthecolorimagesegmentationareaKeywordscolorimagesegmentation,colorspace,histogramthresholding,edgedetection,fuzzytechniques,neuralnetworks1引言图像分割是图像分析和模式识别的首要问题,也是图像处理的经典难题之一,它是图像分析和模式识别系统的重要组成部分,并决定图像的最终分析质量和模式识别的判别结果。
所谓图像分割是指将图像中具有特殊意义的不同区域分开来,并使这些区域相互不相交,且每个区域应满足特定区域的一致性条件。
定义2。
对一幅图像g(z,Y)(0z戈。
,0y),。
;)进行分割就是将图像划分为满足如下收稿日期:
200308-28;改回日期:
200406-29第一作者简介:
林开颜(1975),男,先后于1998年、2001年获长春光学精密机械学院机械设计与制造专业工学学士学位、机械电子工程专业工学硕士学位,2004年获同济大学控制理论与控制工程专业博士学位,现在同济大学现代农业科学与工程研究院工作。
研究方向为智能控制理论与技术、农业计算机视觉技术等。
Email:
ky1in163coln;linkaiyanyahoocoman万方数据2中国图象图形学报第10卷条件的个子区域gi(石,Y),i=1,2,v
(1)Ug;(戈,Y)=g(z,Y),即由所有子区域组成整幅图像;
(2)gi(戈,Y)是连通的区域,连通性是指在该区域内存在连接任意两点的路径;(3)gi(戈,Y)n器(戈,Y)=f2j(i,J=1,2,i白),即任意两个子区域不存在公共元素;(4)区域戤(戈,Y)满足一定的均匀性条件,所谓均匀性(或相似性)是指区域内所有像素点满足灰度、纹理、颜色等特征的某种相似性准则。
因为人眼对亮度具有适应性,即在一幅复杂图像的任一点上只能识别几十种灰度级,但可以识别成千上万种颜色,所以许多情况下,单纯利用灰度信息无法从背景中提取出目标,还必须借助于色彩信息。
由于彩色图像提供了比灰度图像更加丰富的信息,因此随着计算机处理能力的快速提高,彩色图像处理正受到人们越来越多的关注。
2颜色特征空间众所周知,人眼所感知的色彩是由通常称为三基色的红(R)、绿(G)、蓝(B)3种颜色混合而成。
RGB适合于显示系统,但不适合于图像分割和分析,因为R、G、B3个分量是高度相关的,即只要亮度改变,3个分量都会相应改变,而且,由于RGB是一种很不均匀的颜色空间,所以两种颜色之间的知觉差异(色差)不能表示为该颜色空间中两点间的距离,而利用线性或非线性变换,则可以由RGB颜色空间推导出其他的颜色特征空间。
目前虽有多种颜色空间用于彩色图像处理,但由于无论哪一种都无法替代其他的颜色空间而适用于所有彩色图像处理,故选择最佳的颜色空间是彩色图像分割的一个难题3。
线性变换空间有YIQ、YUV、I。
I:
I,【4o等,它们部分消除了RGB的相关性,由于其是线性变换,因此计算量小,其中,Y分量常用于边缘检测,而I,I:
I。
则能够有效地用于彩色图像处理。
非线性变换空间有HSI(HSB、HSL、HSV为HSI的变形)、归一化RGB【51(normalizedRGB,Nrgb)、YT。
T2o(另一种归一化颜色空问)、均匀颜色空间CIE(L+a+b+)及CIE(ru+v+)等,其中HSI与人眼的色彩感知相吻合,其在一些照明不均的场合特别有用,因色调与高亮、阴影无关,色调对区分不同颜色的物体非常有效;Nrgb虽降低了图像亮度对色彩的影响,但不足之处是在低亮度情况下对噪声敏感;CIE是一种均匀颜色空间,能够直接用颜色空间的几何距离进行不同颜色的比较,因此可有效地用于测量小的色差。
虽然非线性变换空间消除了3个颜色分量间的相关性,适合于图像处理,但由于其是非线性变换,因此计算量较大,且颜色空间存在奇异点问题。
灰度图像分割方法
(1)直方图阈值法
(2)特征空间聚类(3)基于区域的方法(4)边缘检测(5)模糊方法(6)神经元网络(7)物理模型方法(8)以上方法组合图1常用彩色图像分割方法Fig1ThetypicMcolorimagesegmentationthehniques3彩色图像分割方法目前,彩色图像分割有多种分类方法,如把图像分割问题看作是基于颜色和空间特征的分类问题,可以分为有监督和无监督分类问题。
Power等将有监督学习算法用于不同的颜色空间(RGB、HSI、Nrgb、混合颜色空间)进行果实图像分割。
有监督算法包括最大似然、决策树、K最近邻、神经元网络等。
Hance等比较了自适应阈值法、模糊c一均值、球坐标变换中心分裂、主分量变换(principalcomponentstransform,PCT)、分裂合并、多分辨率等6种无监督彩色图像分割方法在边界识别算法中的效率,结果显示,自适应阈值法、主分量变换具有较低的错误分割率,若将不同的方法相结合则可以进一步提高肿瘤边界的正确识别率,并且在合并过程中加入启发算法还可以潜在地提高成功率8J。
Pal等对彩色图像分割进行了简要介绍1,并称彩色图像可以作为多光谱图像的一个特例,且任何适用于多光谱图像的分割方法都可以用于彩色图像分割。
另外,大部分的灰度图像分割技术(如直方图万方数据第1期林开颜等:
彩色图像分割方法综述3阈值法、聚类、区域增长、边缘检测、模糊方法、神经元网络等)也可以扩展到彩色图像。
目前,许多彩色图像分割方法不仅把灰度图像分割方法应用于不同的颜色空间,而且可以直接应用于每个颜色分量上,其结果再通过一定的方式进行组合,即可获取最后的分割结果0】。
本文将按图1所示的分类方法对彩色图像分割展开论述。
31直方图阈值化直方图阈值法是灰度图像广泛使用的一种分割方法,它基于对灰度图像的这样一种假设:
目标或背景内部的相邻像素问的灰度值是相似的,但不同目标或背景上的像素灰度差异较大,其反映在直方图上,就是不同目标或背景对应不同的峰。
分割时,选取的阈值应位于直方图两个不同峰之间的谷上,以便将各个峰分开。
0hlander等提出了一种多维直方图阈值化方案1I,其阈值是从不同的颜色空间(RGB、YIQ、HSI)中选取,并用于区域分裂。
对于每个要分裂的区域,先计算尺、G、日、l,、,、Q、H、S、,等9个特征量的直方图后,再确定每个直方图的峰值,然后选出具有最佳峰值的直方图,并从中确定出一个阈值来将要分裂的区域一分为二,对于新分裂出的子区域重复同样的过程,直至每个区域都是相似的,不能再进行分裂为止。
Guo等对图像数据在多维特征空间的多峰概率密度函数,则采用基于直方图熵的方法来确定峰和谷。
与灰度图像不同的是,彩色图像有3个颜色分量,其直方图是一个3维数组,在这样的直方图中确定阈值是比较困难的。
一种解决方法是将3维空间往低维空问投影,Underwood等把3维颜色空间(x,Y,I)投影到2维平面(XY、X,、Y-I)013,以便从航空彩色图像中交互地检测出果园中植物的病害情况。
Kurugollu等提出了一种多频谱图像分割方法4I,即对于彩色图像,首先选取F。
、FR。
、F。
为频谱子集,并在计算3个频谱子集的2维直方图后,再进行多阈值化处理,然后利用融合算法对根据3个子集的2维直方图分割的图像进行合成。
对于频谱数较多的图像,可以利用主分量变换(KL变换)将频谱数减少到3。
如果阈值化操作只是在单个颜色分量上进行,则由于忽略了3个颜色分量问的相关性,因此提取区域不能同时考虑3个颜色分量的信息。
若能够找到一条直线,使得投影在其上的3维空间的点能够很好地分开,这样既能对颜色空问进行降维处理,又可以同时利用3个颜色分量的信息。
Celenk利用Fisher线性判别来确定这样一条直线,用于1维直方图阈值化引,它是在CIE(La+b+)3维颜色空间中进行操作的,即先利用定义在CIE(L+a+b+)空间上的H、S、I3个分量的1维直方图来估计像素点在3维颜色空间分布的圆形柱面体单元的形状,并将每个柱面单元内的像素点投影到Fisher线性判别方法所确定的直线上,再利用1维直方图阈值化方法就可以对柱面单元所确定的区域进行分割。
由于这种方法可以同时利用所有的颜色信息,因此有效地减少了聚类的错误率,类似的应用还可参见文献16,17。
直方图阈值法不需要先验信息,且计算量较小,但缺点是:
(1)单独基于颜色分割得到的区域可能是不完整的;
(2)在复杂图像的各个分量直方图中并不一定存在明显的谷,用来进行阈值化分割;(3)当像素颜色映射到3个直方图的不同位置时,颜色信息会发散;(4)没有利用局部空间信息。
32特征空间聚类特征空间聚类算法不需要训练样本,是一种无监督的统计方法,它是通过迭代地执行分类算法来提取各类的特征值,其中K一均值819J、模糊c一均值(FuzzyCmean,FCM)旧1等是最常用的分类方法。
对于彩色图像,颜色空间本身就是一种特征空间,颜色空间聚类方法用于彩色图像分割具有直观易于实现的特点,并且能同时利用3个分量的颜色信息,但它的最大问题是要事先确定聚类数目,即需先进行聚类的有效性分析。
对于FCM,目前已有不少分类指标,如基于隶属度矩阵的分割系数(partitioncoefficient,PC)和分割熵(partitionentropy,PE),还有考虑数据点紧密度一分离度(compactnessseparation)的XieBeni指标和Fukayamasugno指标,以及将紧密度一分离度和隶属度矩阵特性进行综合的Sc指标k“1。
Carevic等提出了基于如下特征向量的K一均值聚类彩色图像分割方法8I:
Kx。
=a嚣(戈,Y),仅罡(z,Y),OL层(戈,Y),局打;(菇,Y),届打:
(z,Y),胁;(戈,Y),yx“,YY“,其中,(z,Y)像素坐标,l、,2、厶为R、G、B的线性变换;or。
(搿,Y),盯G(石,Y),盯。
(戈,Y)为像素(戈,Y)及其8邻域像素的R、G、B的偏差;上标n表示该分量归一化为0均值、单位标准偏差的变量。
该特征量既考虑了空间的相关信息,也提供了图像的二阶统计信息,其不仅使得聚类在万方数据4中国图象图形学报第10卷空间上是连续的,并且通过调整控制因子OL、届、y还可以提高聚类性能。
这种在特征向量中考虑与邻域像素关系的方法还可见参考文献23。
Lim等把直方图阈值化和FCM相结合用于彩色图像分割J,并分为粗分和细分两个阶段。
在粗分阶段,先利用尺度空问滤波器来确定各分量的阈值,然后用该阈值把颜色空间分为若干个六面体,当某个六面体包含的像素超过一个预先确定的阈值时,就被认为是一个有效的聚类,而直方图中的峰值则可以用于确定聚类中心;细分阶段,则根据在粗分阶段所确定的聚类中心,再利用FCM算法来对未被划分的像素再进行分类。
这种方法试图先在粗分阶段确定聚类的数目和中心点,以及解决FCM计算量大的问题,但由于是基于直方图不是单峰的这一种假设,因此与大多数直方图方法具有同样的缺点。
为了提高FCM的运算速度,刘健庄等在图像数据集上建立了一种塔型结构,并先将每一层四邻域的颜色均值作为上层像素点的颜色值,然后用塔顶端的数据来进行聚类旧5I,这虽然提高了运算速度,但由于其是一种降低图像分辨率的做法,从而导致了图像有用信息的丢失。
林开颜等利用分层减法聚类方法把图像数据分成一定数量的色彩相近的子集心6|,一方面,子集中心用于初始化聚类中心点;另一方面,利用子集中心点和分布密度来进行模糊聚类,由于聚类样本数量显著减少以及分层减法聚类计算量小,故可以大幅提高模糊c一均值算法的计算速度,进而可以利用聚类有效性分析指标来快速确定聚类数目。
与传统FMC算法每次迭代都要对所有聚类中心同时进行优化不同的是,Chen等提出了一种新的模糊聚类算法呤7I,即在算法中的隶属度函数考虑了与其他类的关系,由于聚类中心可逐一通过迭代优化产生,故减少了计算量。
Michael等在分析向量量化和聚类关系的基础上,以最小平方和作为准则,利用竞争学习优化的权向量作为聚类中心,实现了彩色图像分割L281,并讨论了不同颜色空间变换对于图像分割结果的影响。
虽然聚类分析不需要训练集,但需要事先确定分类个数,且初始参数对分类结果影响较大;另方面,由于聚类也没有考虑空问信息,因而对噪声敏感。
33基于区域的方法331区域生长、区域分裂、合并及两者的组合区域生长的基本思想是将具有相似性质的像素集合起来构成区域,而区域分裂技术则是将种子区域不断分裂为4个矩形区域,直到每个区域内部都是相似的为止。
区域合并通常和区域生长、区域分裂技术相结合,以便把相似的子区域合并成尽可能大的区域。
当图像区域的同一性准则容易定义时,则这些方法分割质量较好,并且不易受噪声影响。
典型的同一性准则是通过统计的方法确定的,文献4,11,15利用区域分裂的方法进行图像分割,其所用同一性准则是用颜色分量的1维直方图来确定的。
Tremeau等提出了一种将区域生长和区域合并技术相结合的彩色图像分割方法旧1,即先利用RGB颜色空间的欧氏距离定义了3个色彩同一性准则,并将其分别用于两个相邻像素之间、某个像素与已定义的相邻区域内像素之问以及其均值的比较。
分割时,先利用基于颜色相似度和空间相近度的准则进行区域生长,然后根据基于色彩相似性的全局同一性准则来对区域生长形成的区域进行合并,以生成空间分离、但色彩相近的分割区域。
这种方法缺点是这些准则所对应阈值的选取具有主观性,并且不适合分割具有阴影区域的图像。
为了识别彩色图像中的小目标和局部变化,Cheng等提出了一种分层的分割方法,即通过对同一性直方图进行阈值化操作来辨识同一个区域,并将同一性定义为亮度,的偏差(像素邻域内的亮度标准偏差)和突变(像素亮度Sobel算子的梯度模)两个变量的函数。
这两种方法由于同时考虑了局部信息和全局信息,故分割质量较好。
区域生长的固有缺点是分割效果依赖于种子点的选择及生长顺序,区域分裂技术的缺点是可能会使边界被破坏。
由于相似性通常是用统计的方法确定的,因而这些方法对噪声不敏感。
332分水岭分割方法分水岭(watershed)是地形学的经典概念,也是图像形态学的一个主要算子。
在图像处理领域,计算分水岭的算法有很多,其中,典型的一种方法是基于浸没模拟(immersionsimulation)川思想,即把图像视为地形表面,像素的灰度对应于地形高度,其局部最小值对应地形的洞。
设想将地形表面浸入一个湖中,从最小值开始,水会逐渐充满各个不同的聚水盆地,当来自相邻聚水盆地的水要合并时,若在该处建立一个堤坝,则浸没结束时,所建立的堤坝就对应于区域的轮廓,而聚水盆地则对应分割区域。
在分水岭的分割方法中,需首先进行标记提取,然后对待分割图像的梯度信号使用分水岭算法来分万方数据第1期林开颜等:
彩色图像分割方法综述5割出已被标记的感兴趣的物体。
这种标记选取不仅是分水岭算法的一个主要难点旧2|,而且选取不当会导致图像过分割。
为避免过分割,需先选取标记,如今已有不少标记提取方法如Shafarenko等通过对原图像进行形态“闭”运算来对“伪”谷底进行填充,以获得更有意义的局部极值点作为标记”3|;Shiji等利用“闭”运算填充后的直方图来产生标记图像,并在标记图像的梯度和原图像特征值变化均比较缓慢的地方选取标记34|;Lezoray等从贝叶斯分类器分类的结果中选取标记日2】;马丽红等则先对图像开闭滤波的结果做二值标记预处理,并将其作为初始分割步骤,然后将所得的分割结果作为分水岭算法的种子(标记)纠等。
333基于随机场的方法马尔科夫随机场(Markovrandomfield,MRF)是图像分割中最常用的一种统计学方法,其实质是把图像中各个点的颜色值看成是具有一定概率分布的随机变量。
从统计学的角度看,正确分割观察到的图像,就是以最大概率得到图像的物体组合;从贝叶斯定理看,就是要求具有最大后验概率(maximumaposteriori,MAP)的分布。
MRF最重要的一个特点是,图像中每个点的取值是由其邻域像素决定的,其本质上是一种基于局部区域的分割方法。
HammersleyClifford定理6。
为MRF中局部特性的条件概率和Gibbs分布中的局部势能之问建立了等价关系,这样,MAP的求解就转变为极小化一个势能函数的优化问题。
常用的MAP求解方法有模拟退火(simulatedannealing,SA)旧6。
、迭代条件模式(iteratedco
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 彩色 图像 分割 方法 综述