直方图均衡化.docx
- 文档编号:10321589
- 上传时间:2023-05-25
- 格式:DOCX
- 页数:14
- 大小:224.56KB
直方图均衡化.docx
《直方图均衡化.docx》由会员分享,可在线阅读,更多相关《直方图均衡化.docx(14页珍藏版)》请在冰点文库上搜索。
直方图均衡化
1直方图均衡化原理、目标、应用及编程实现
1.1直方图均衡化原理
直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。
直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。
直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。
直方图规定化
直方图均衡化的优点是能自动增强整个图像的对比度,但它的具体增强效果不易控制,处理的结果总是得到全局的均衡化的直方图.实际工作中,有时需要变换直方图使之成为某个特定的形状,从而有选择地增强某个灰度值范围内的对比度,这时可采用比较灵活的直方图规定化方法.
直方图规定化增强处理的步骤如下:
令Pr(r)和Pz(z)分别为原始图像和期望图像的灰度概率密度函数。
如果对原始图像和期望图像均作直方图均衡化处理,应有
(1)
(2)
(3)
由于都是进行均衡化处理,处理后的原图像概率密度函数Ps(S)及理想图像概率密度函数PV(V)是相等的。
于是,我们可以用变换后的原始图像灰度级S代替
(2)式中的V。
即
Z=G-1(S)(4)
这时的灰度级Z便是所希望的图像的灰度级。
此外,利用
(1)与(3)式还可得到组合变换函数
Z=G-1[T(r)](5)
对连续图像,重要的是给出逆变换解析式。
对离散图像而言,有
(6)
(7)
(8)
1.2直方图均衡化目标及应用
这种方法通常用来增加许多图像的局部对比度,尤其是当图像的有用数据的对比度相当接近的时候。
通过这种方法,亮度可以更好地在直方图上分布。
这样就可以用于增强局部的对比度而不影响整体的对比度,直方图均衡化通过有效地扩展常用的亮度来实现这种功能。
这种方法对于背景和前景都太亮或者太暗的图像非常有用,尤其是可以带来X光图像中更好的骨骼结构显示以及曝光过度或者曝光不足照片中更好的细节。
该方法的一个主要优势是它是一个相当直观的技术并且是可逆操作,如果已知均衡化函数,那么就可以恢复原始的直方图,并且计算量也不大。
1.3直方图均衡化编程实现
%直方图均衡化
I=imread('rice.png');
[height,width]=size(I);
figure
subplot(221)
imshow(I)%显示原始图像
subplot(222)
imhist(I)%显示原始图像直方图
%进行像素灰度统计;
NumPixel=zeros(1,256);%统计各灰度数目,共256个灰度级
fori=1:
height
forj=1:
width
NumPixel(I(i,j)+1)=NumPixel(I(i,j)+1)+1;%对应灰度值像素点数量增加1
end
end
%计算灰度分布密度
ProbPixel=zeros(1,256);
fori=1:
256
ProbPixel(i)=NumPixel(i)/(height*width*1.0);
end
%计算累计直方图分布
CumuPixel=zeros(1,256);
fori=1:
256
ifi==1
CumuPixel(i)=ProbPixel(i);
else
CumuPixel(i)=CumuPixel(i-1)+ProbPixel(i);
end
end
%累计分布取整
CumuPixel=uint8(255.*CumuPixel+0.5);
%对灰度值进行映射(均衡化)
fori=1:
height
forj=1:
width
I(i,j)=CumuPixel(I(i,j));
end
end
subplot(223)
imshow(I)%显示原始图像
subplot(224)
imhist(I)%显示原始图像直方图
2了解RGB、HSV系统
2.1RGB系统
RGB色彩模式(也翻译为“红绿蓝”,比较少用)是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
RGB色彩模式使用RGB模型为图像中每一个像素的RGB分量分配一个0~255范围内的强度值。
例如:
纯红色R值为255,G值为0,B值为0;灰色的R、G、B三个值相等(除了0和255);白色的R、G、B都为255;黑色的R、G、B都为0。
RGB图像只使用三种颜色,就可以使它们按照不同的比例混合,在屏幕上重现16777216种颜色。
在RGB模式下,每种RGB成分都可使用从0(黑色)到255(白色)的值。
例如,亮红色使用R值246、G值20和B值50。
当所有三种成分值相等时,产生灰色阴影。
当所有成分的值均为255时,结果是纯白色;当该值为0时,结果是纯黑色
2.2HSV系统
HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(HexconeModel)。
这个模型中颜色的参数分别是:
色调(H),饱和度(S),明度(V)。
色调H
用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。
它们的补色是:
黄色为60°,青色为180°,品红为300°;
饱和度S
饱和度S表示颜色接近光谱色的程度。
一种颜色,可以看成是某种光谱色与白色混合的结果。
其中光谱色所占的比例愈大,颜色接近光谱色的程度就愈高,颜色的饱和度也就愈高。
饱和度高,颜色则深而艳。
光谱色的白光成分为0,饱和度达到最高。
通常取值范围为0%~100%,值越大,颜色越饱和。
明度V
明度表示颜色明亮的程度,对于光源色,明度值与发光体的光亮度有关;对于物体色,此值和物体的透射比或反射比有关。
通常取值范围为0%(黑)到100%(白)。
RGB和CMY颜色模型都是面向硬件的,而HSV(HueSaturationValue)颜色模型是面向用户的。
HSV模型的三维表示从RGB立方体演化而来。
设想从RGB沿立方体对角线的白色顶点向黑色顶点观察,就可以看到立方体的六边形外形。
六边形边界表示色彩,水平轴表示纯度,明度沿垂直轴测量。
六棱锥模型
H参数表示色彩信息,即所处的光谱颜色的位置。
该参数用一角度量来表示,红、绿、蓝分别相隔120度。
互补色分别相差180度。
纯度S为一比例值,范围从0到1,它表示成所选颜色的纯度和该颜色最大的纯度之间的比率。
S=0时,只有灰度。
V表示色彩的明亮程度,范围从0到1。
有一点要注意:
它和光强度之间并没有直接的联系。
3数字相机成像过程以及像素计算
3.1数字相机成像过程
数字相机(又名数码相机,英文全称:
DigitalCamera 简称DC)。
数字相机,是一种利用电子传感器把光学影像转换成电子数据的照相机。
与普通照相机在胶卷上靠溴化银的化学变化来记录图像的原理不同,数字相机的传感器是一种光感应式的电荷耦合(CCD)或互补金属氧化物半导体(CMOS)。
在图像传输到计算机以前,通常会先储存在数码存储设备中(通常是使用闪存;软磁盘与可重复擦写光盘(CD-RW)已很少用于数字相机设备)。
传统相机使用碘化银感光材料(即胶片)作为保存影像的载体。
人们通过镜头将影像的光线汇聚,再通过按动快门打开快门帘将汇聚的光线投射到胶片上,胶片中的碘化银会根据光线中不同的颜色波长凝结成不同的图像保存在胶片上。
相机机身的作用是一个暗箱。
数码相机使用的是CCD或者CMOS等感光电子元件作为感光介质。
使用它们可以使镜头聚焦的光线由光信号转变为电信号,再经过模拟数字转换器转换成数字信号,压缩和存储为特定图像格式保存在存储介质上(可以反复使用)。
对于数字相机,成像过程远远比胶片上复杂。
但不管数字成像技术如何发展,成像原理和基本要素还是和胶片成像过程相类似的。
数字相机也有镜头,但通过镜头的光线不再像胶片相机中那样投射到胶片上,而是直接射在感光器的光敏单元上,这些感光器由半导体元件构成,由数字相机的内置智能控制装置对入射光线进行分析处理,并自动调整合适的焦距、暴光时间、色度、白平衡等参数,然后将这些数据传送给模/数转换器ADC(AnalogDigitalConverter),ADC最后把这些电子模拟信号转换成数字信号。
数字相机的内部还具有若干智能处理器,包括一些特定用途的集成电路(ASIC)和主CPU。
按照这些内部处理器预设的运算法则和标准处理程序,所有数据经处理最终生成一个图像文件,然后存储在相机内部的电子存储器中。
当这些过程结束后,图像文件就能够传输到计算机中,经由打印机输出或者显示在电视屏幕上。
同时图像文件也能够在相机内部显示,通过自带的LCD显示屏进行预览,并利用相机LCD显示屏的操作菜单进行处理,对于不满意的图像可以删除后重新拍摄。
数码技术的成像是通过光学镜头,用CCD或CMOS电子元件记录光信号,并通过二进制的数字构成影像,其表述影像质量的指标也从线对数变成了像素和色彩深度。
CCD或CMOS的像素数就成了决定画质的重要因素。
像素数越多,CCD的面积越大,图像质量就越高。
数码相机的像素一般都在5-14百万像素。
数码相机的精度由二部分组成;像素+色彩深度。
所谓色彩深度,就是每一种颜色色别和灰度的细分程度。
其数值越大,精度越高,色彩就越丰富,成像质量就越好。
像素是构成数码图像的最基本元素,它们是数码图像最基本的单位,数以千计的像素就构成了栩栩如生的数码图像。
然后数码相机将所拍摄的图象,通过图像处理器处理,以像素的形式存储在数码相机的内存或存储卡中。
3.2像素计算
①图像占用空间的大小计算:
大小=分辨率*位深/8
分辨率=宽*高(如:
1024*768,640*480)
位深:
如24位,16位,8位
/8计算的是字节数。
例如:
一幅图像分辨率:
1024*768,24位,则其大小计算如下:
大小=1024*768824/8=2359296byte=2304KB
②图像物理尺寸的大小计算:
厘米和像素没任何关系,厘米是长度单位,什么是象素呢?
像素是组成图像的最基本单元。
它是一个小的方形的颜色块。
一个图像通常由许多像素组成,这些像素被排成横行或纵列,每个像素都是方形的。
当你用缩放工具将图像放到足够大时,就可以看到类似马赛克的效果,每个小方块就是一个像素。
每个像素都有不同的颜色值。
单位面积内的像素越多,分辨率(dpi)越高,图像的效果就越好。
显示器上正常显示的图像,当放大到一定比例后,就会看到类似马赛克的效果。
每个小方块为一个像素,也可称为栅格。
像素图的质量是由分辨率决定的,单位面积内的像素越多,分辨率越高,图像的效果就越好。
③DPI计算
这幅图像分辨率200*200dpi,大小450*450像素,那么就可以得到:
图像大小=图像大小/分辨率=450/200=2.25
所以,这幅图像的大小为2.25*2.25英寸
如果要求图像大小变成1.5*1.5英寸,但像素数仍为450*450,按照公式:
图像大小=图像像素数/图像分辨率,就得到了图像的分辨率应为:
450/1.5=300dpi
4傅里叶变换原理以及物理意义
4.1傅里叶变换原理
一个周期为2l的函数
满足一定的条件可以展开傅里叶级数为:
(1)
其中
,
为傅里叶系数,分别为:
(n=0,1,2…)
(n=0,1,2…)
化简后可以得到其复数形式:
对于函数
在一定条件下可以有复数条件下的傅里叶积分表达式:
(2)
(3)
和
之间可以通过积分来表示,式
(2)为函数
的傅里叶变换,式(3)为函数
的傅里叶逆变换。
这一傅里叶变换对的使用条件为:
1)函数
处处有界,而且存在有限个第一类不间断点;
2)除有限个点外,
和
处处存在微商;
3)
绝对可积,既
。
上述条件称为狄里赫利充分条件。
4.2傅立叶变换的物理意义
傅立叶变换是数字信号处理领域一种很重要的算法。
要知道傅立叶变换算法的意义,首先要了解傅立叶原理的意义。
傅立叶原理表明:
任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。
而根据该原理创立的傅立叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。
和傅立叶变换算法对应的是反傅立叶变换算法。
该反变换从本质上说也是一种累加处理,这样就可以将单独改变的正弦波信号转换成一个信号。
因此,可以说,傅立叶变换将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱),可以利用一些工具对这些频域信号进行处理、加工。
最后还可以利用傅立叶反变换将这些频域信号转换成时域信号。
从现代数学的眼光来看,傅里叶变换是一种特殊的积分变换。
它能将满足一定条件的某个函数表示成正弦基函数的线性组合或者积分。
在不同的研究领域,傅里叶变换具有多种不同的变体形式,如连续傅里叶变换和离散傅里叶变换。
在数学领域,尽管最初傅立叶分析是作为热过程的解析分析的工具,但是其思想方法仍然具有典型的还原论和分析主义的特征。
"任意"的函数通过一定的分解,都能够表示为正弦函数的线性组合的形式,而正弦函数在物理上是被充分研究而相对简单的函数类:
1.傅立叶变换是线性算子,若赋予适当的范数,它还是酉算子;2.傅立叶变换的逆变换容易求出,而且形式与正变换非常类似;3.正弦基函数是微分运算的本征函数,从而使得线性微分方程的求解可以转化为常系数的代数方程的求解.在线性时不变杂的卷积运算为简单的乘积运算,从而提供了计算卷积的一种简单手段;4.离散形式的傅立叶的物理系统内,频率是个不变的性质,从而系统对于复杂激励的响应可以通过组合其对不同频率正弦信号的响应来获取;5.著名的卷积定理指出:
傅立叶变换可以化复变换可以利用数字计算机快速的算出(其算法称为快速傅立叶变换算法(FFT))。
正是由于上述的良好性质,傅里叶变换在物理学、数论、组合数学、信号处理、概率、统计、密码学、声学、光学等领域都有着广泛的应用。
4.3图像傅立叶变换的物理意义
图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。
如:
大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对于地表属性变换剧烈的边缘区域在图像中是一片灰度变化剧烈的区域,对应的频率值较高。
傅立叶变换在实际中有非常明显的物理意义,设f是一个能量有限的模拟信号,则其傅立叶变换就表示f的谱。
从纯粹的数学意义上看,傅立叶变换是将一个函数转换为一系列周期函数来处理的。
从物理效果看,傅立叶变换是将图像从空间域转换到频率域,其逆变换是将图像从频率域转换到空间域。
换句话说,傅立叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,傅立叶逆变换是将图像的频率分布函数变换为灰度分布函数。
傅立叶变换以前,图像(未压缩的位图)是由对在连续空间(现实空间)上的采样得到一系列点的集合,我们习惯用一个二维矩阵表示空间上各点,则图像可由z=f(x,y)来表示。
由于空间是三维的,图像是二维的,因此空间中物体在另一个维度上的关系就由梯度来表示,这样我们可以通过观察图像得知物体在三维空间中的对应关系。
为什么要提梯度?
因为实际上对图像进行二维傅立叶变换得到频谱图,就是图像梯度的分布图,当然频谱图上的各点与图像上各点并不存在一一对应的关系,即使在不移频的情况下也是没有。
傅立叶频谱图上我们看到的明暗不一的亮点,实际上图像上某一点与邻域点差异的强弱,即梯度的大小,也即该点的频率的大小(可以这么理解,图像中的低频部分指低梯度的点,高频部分相反)。
一般来讲,梯度大则该点的亮度强,否则该点亮度弱。
这样通过观察傅立叶变换后的频谱图,也叫功率图,我们首先就可以看出,图像的能量分布,如果频谱图中暗的点数更多,那么实际图像是比较柔和的(因为各点与邻域差异都不大,梯度相对较小),反之,如果频谱图中亮的点数多,那么实际图像一定是尖锐的,边界分明且边界两边像素差异较大的。
对频谱移频到原点以后,可以看出图像的频率分布是以原点为圆心,对称分布的。
将频谱移频到圆心除了可以清晰地看出图像频率分布以外,还有一个好处,它可以分离出有周期性规律的干扰信号,比如正弦干扰,一副带有正弦干扰,移频到原点的频谱图上可以看出除了中心以外还存在以某一点为中心,对称分布的亮点集合,这个集合就是干扰噪音产生的,这时可以很直观的通过在该位置放置带阻滤波器消除干扰。
5数字化的过程
要在计算机中处理图像,必须先把真实的图像(照片、画报、图书、图纸等)通过数字化转变成计算机能够接受的显示和存储格式,然后再用计算机进行分析处理。
图像的数字化过程主要分采样、量化与编码三个步骤。
1.采样
采样的实质就是要用多少点来描述一幅图像,采样结果质量的高低就是用前面所说的图像分辨率来衡量。
简单来讲,对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构,所形成的微小方格称为像素点。
一副图像就被采样成有限个像素点构成的集合。
例如:
一副640*480分辨率的图像,表示这幅图像是由640*480=307200个像素点组成。
采样频率是指一秒钟内采样的次数,它反映了采样点之间的间隔大小。
采样频率越高,得到的图像样本越逼真,图像的质量越高,但要求的存储量也越大。
在进行采样时,采样点间隔大小的选取很重要,它决定了采样后的图像能真实地反映原图像的程度。
一般来说,原图像中的画面越复杂,色彩越丰富,则采样间隔应越小。
由于二维图像的采样是一维的推广,根据信号的采样定理,要从取样样本中精确地复原图像,可得到图像采样的奈奎斯特(Nyquist)定理:
图像采样的频率必须大于或等于源图像最高频率分量的两倍。
2.量化
量化是指要使用多大范围的数值来表示图像采样之后的每一个点。
量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。
例如:
如果以4位存储一个点,就表示图像只能有16种颜色;若采用16位存储一个点,则有216=65536种颜色。
所以,量化位数越来越大,表示图像可以拥有更多的颜色,自然可以产生更为细致的图像效果。
但是,也会占用更大的存储空间。
两者的基本问题都是视觉效果和存储空间的取舍。
假设有一幅黑白灰度的照片,因为它在水平于垂直方向上的灰度变化都是连续的,都可认为有无数个像素,而且任一点上灰度的取值都是从黑到白可以有无限个可能值。
通过沿水平和垂直方向的等间隔采样可将这幅模拟图像分解为近似的有限个像素,每个像素的取值代表该像素的灰度(亮度)。
对灰度进行量化,使其取值变为有限个可能值。
经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的图像称为数字图像。
只要水平和垂直方向采样点数足够多,量化比特数足够大,数字图像的质量就比原始模拟图像毫不逊色。
在量化时所确定的离散取值个数称为量化级数。
为表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长,一般可用8位、16位、24位或更高的量化字长来表示图像的颜色;量化字长越大,则越能真实第反映原有的图像的颜色,但得到的数字图像的容量也越大。
3.压缩编码
数字化后得到的图像数据量十分巨大,必须采用编码技术来压缩其信息量。
在一定意义上讲,编码压缩技术是实现图像传输与储存的关键。
目前已有许多成熟的编码算法应用于图像压缩。
常见的有图像的预测编码、变换编码、分形编码、小波变换图像压缩编码等。
当需要对所传输或存储的图像信息进行高比率压缩时,必须采取复杂的图像编码技术。
但是,如果没有一个共同的标准做基础,不同系统间不能兼容,除非每一编码方法的各个细节完全相同,否则各系统间的连接十分困难。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直方图 均衡