数字图像处理及MATLAB实现7.ppt
- 文档编号:18743143
- 上传时间:2023-10-26
- 格式:PPT
- 页数:55
- 大小:4.48MB
数字图像处理及MATLAB实现7.ppt
《数字图像处理及MATLAB实现7.ppt》由会员分享,可在线阅读,更多相关《数字图像处理及MATLAB实现7.ppt(55页珍藏版)》请在冰点文库上搜索。
7.1概述(Introduction),7.2无失真图像压缩编码(Losslessimagecompression),7.3有限失真图像压缩编码(Lossyimagecompression),7.4图像编码新技术(NewImageCompressionTechnology),图像压缩编码(ImageCompressionCodingTechnology),7.5图像压缩技术标准(ImageCompressionStandards),举例1:
对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:
640*480*24*30=221.12M,1张CD可存640M,如果不进行压缩,1张CD则仅可以存放2.89秒的数据举例2:
目前的WWW互联网包含大量的图像信息,如果图像信息的数据量太大,会使本来就已经非常紧张的网络带宽变得更加不堪重负(WorldWideWeb变成了WorldWideWait),概述(Introduction),为什么要对图像进行压缩,1.信息量,图像的信息量与信息熵(InformationContentandEntropy),设信息源X可发出的消息符号集合为,并设X发出符号,的概率,为,则定义符号出现的自信息量为:
通常,上式中的对数取2为底,这时定义的信息量单位为“比特”(bit)。
2.信息熵,),对信息源X的各符号的自信息量取统计平均,可得每个符号的平均自信息量为:
这个平均自信息量H(X)称为信息源X的熵(entropy),单位为bit/符号,通常也称为X的零阶熵。
由信息论的基本概念可以知道,零阶熵是无记忆信息源(在无失真编码时)所需数码率的下界。
7.1.1、图像的信息量与信息熵(InformationContentandEntropy),通常一副图像中的各点像素点之间存在一定的相关性。
特别是在活动图像中,由于两幅相邻图像之间的时间间隔很短,因此这两幅图像信息中包含了大量的相关信息。
这些就是图像信息中的冗余。
7.1.2、图像数据冗余(Imagedataredundancy),1.空间冗余图7.2是一幅图像,其中心部分为一个灰色的方块,在灰色区域中的所有像素点的光强和彩色以及饱和度都是相同的,因此该区域中的数据之间存在很大的冗余度。
图像数据冗余(Imagedataredundancy),图7.2空间冗余,空间冗余是图像数据中最基本的冗余。
要去除这种冗余,人们通常将其视为一个整体,并用极少的数据量来表示,从而减少邻近像素之间的空间相关性,已达到数据压缩的目的。
2.时间冗余由于活动图像序列中的任意两相邻的图像之间的时间间隔很短,因此两幅图像中存在大量的相关信息,如图7.3所示。
时间冗余是活动图像和语音数据中经常存在的一种冗余。
图像数据冗余(Imagedataredundancy),图7.3时间冗余,3.信息熵冗余信息熵冗余是针对数据的信息量而言的。
设某种编码的平均码长为,图像数据冗余(Imagedataredundancy),式中,为分配给第符号的比特数,为符号出现的概率。
这种压缩的目的就是要使L接近,4.结构冗余图7.4表示了一种结构冗余。
从图中可以看出。
它存在着非常强的纹理结构,这使图像在结构上产生了冗余。
图7.4结构冗余,图像数据冗余(Imagedataredundancy),5知识冗余随着人们认识的深入,某些图像所具有的先验知识,如人脸图像的固有结构(包括眼、耳、鼻、口等)为人们所熟悉。
这些由先验知识得到的规律结构就是知识冗余。
6.视觉冗余由于人眼的视觉特性所限,人眼不能完全感觉到图像画面的所有细小的变化。
例如人眼的视觉对图像边缘的剧烈变化不敏感,而对图像的亮度信息非常敏感,因此经过图像压缩后,虽然丢了一些信息,但从人眼的视觉上并未感到其中的变化,而仍认为图像具有良好的质量。
图像数据冗余(Imagedataredundancy),数字图像压缩编码分类方法有很多,但从不同的角度,可以有不同的划分。
从信息论角度分,可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。
图像压缩编码分类(CodingmethodsofImageCompression,无失真图像压缩编码利用图像信源概率分布的不均匀性,通过变长编码来减少信源数据冗余,使编码后的图像数据接近其信息熵而不产生失真,因而也通常被称为熵编码。
有限失真编码则是根据人眼视觉特性,在允许图像产生一定失真的情况下(尽管这种失真常常不为人眼所觉察),利用图像信源在空间和时间上具有较大的相关性这一特点,通过某一种信号变换来消除信源的相关性、减少信号方差,达到压缩编码的目的。
1.压缩比为了表明某种压缩编码的效率,通常引入压缩比这一参数,它的定义为:
压缩技术的性能指标(EvaluationIndexofImageCompressionapproaches),其中表示压缩前图像每像素的平均比特数,表示压缩后每像素所需的平均比特数,一般的情况下压缩比c总是大于等于1的,c愈大则压缩程度愈高。
2.平均码字长度平均码字长度:
设为数字图像第k个码字的长度(编码成二进制码的位数)。
其相应出现的概率为,则该数字图像所赋予的平均码字长度为:
3.编码效率在一般情况下,编码效率往往可用下列简单公式表示:
单位为bit,7.1.4、压缩技术的性能指标(EvaluationIndexofImagecompressionapproaches),无失真失真图像压缩编码就是指图像经过压缩、编码后恢复的图像与原图像完全样,没有任何失真.常用的无失真图像压缩编码有许多种。
如哈夫曼(Huffman)编码、游程编码和算术编码。
无失真图像压缩编码(Losslessimagecompression),当图像不太复杂时,往往存在着灰度或颜色相同的图像子块。
由于图像编码是按照顺序对每个像素进行编码的,因而会存在多行的数据具有相同数值的情况,这样可只保留两连续相同像素值和像素点数目。
这种方法就是游程编码。
下面以一个具体的二值序列为例进行说明。
已知一个二值序列00101110001001,根据游程编码的规则,可知其游程序列为21133121。
可见图像中具有相同灰度(或颜色)的图像块越大、越多,压缩的效果就越好,反之当图像越复杂,即其中的颜色层次越多时,则其压缩效果越不好,因此对于复杂的图像,通常采用游程编码与Huffman编码的混合编码方式,即首先进行二值序列的游程编码,然后根据“0”游程与“1”游程长度的分布概率,再进行Huffman编码。
游程编码(Run-lengthcoding),算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率。
再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。
消息序列中的每个元素都要缩短为一个区间。
消息序列中元素越多,所得到的区间就越小。
当区间变小时,就需要更多的数位来表示这个区间。
采用算术编码,每个符号的平均编码长度可以为小数。
算术编码(Arithmeticcoding),算术编码(Arithmeticcoding),算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率。
再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。
消息序列中的每个元素都要缩短为一个区间。
消息序列中元素越多,所得到的区间就越小。
当区间变小时,就需要更多的数位来表示这个区间。
采用算术编码,每个符号的平均编码长度可以为小数。
算术编码(Arithmeticcoding),举例:
假设信源符号为X=00,01,10,11,其中各符号的概率为P(X)=0.1,0.4,0.2,0.3。
对这个信源进行算法编码的具体步骤如下:
1)已知符号的概率后,就可以沿着“概率线”为每个符号设定一个范围:
0,0.1),0.1,0.5),0.5,0.7),0.7,1.0)。
把以上信息综合到表7.1中。
2)假如输入的消息序列为:
10、00、11、00、10、11、01,其算术编码过程为:
第一步:
初始化时,范围range为1.0,低端值low为0。
下一个范围的低、高端值分别由下式计算:
其中等号右边的range和low为上一个被编码符号的范围和低端值;range_low和range_high分别为被编码符号已给定的出现概率范围的低端值和高端值。
7.2.3算术编码(Arithmeticcoding),算术编码(Arithmeticcoding),对第一个信源符号10编码:
所以,信源符号10将区间,下一个信源符号的范围为,第二步:
对第二个信源符号00编码:
所以信源符号00将区间,下一个信源符号的范围为,算术编码(Arithmeticcoding),第三步:
对第三个信源符号11编码:
所以信源符号11将区间,下一个信源符号的范围为,第四步:
对信源符号00编码:
下一个信源符号的范围为。
算术编码(Arithmeticcoding),第五步:
对第五个信源符号10编码:
所以,信源符号10将区间,下一个信源符号的范围为,第六步:
对第六个信源符号11编码:
所以,信源符号11将区间,算术编码(Arithmeticcoding),下一个信源符号的范围为,第七步:
对第七个信源符号01编码:
所以,信源符号01将区间,最后从0.5143876,0.514402中选择一个数作为编码输出,这里选择0.5143876。
综上所述,算术编码是从全序列出发,采用递推形式的一种连续编码,使得每个序列对应该区间内一点,也就是一个浮点小数;这些点把0,1)区间分成许多小段,每一段长度则等于某序列的概率。
再在段内取一个浮点小数,其长度可与序列的概率匹配,从而达到高效的目的。
7.2.3算术编码(Arithmeticcoding),解码是编码的逆过程,通过编码最后的下标界值0.5143876得到信源“10001100101101”是唯一的编码。
解码操作过程综合如下:
7.2.3算术编码(Arithmeticcoding),从以上算术编码算法可以看出,算术编码具有以下特点:
1、由于实际的计算机精度不可能无限长,运算中会出现溢出问题。
2、算术编码器对整个消息只产生一个码字,这个码字是在0,1)之间的一个实数,因此译码器必须在接收到这个实数后才能译码。
3、算术编码也是一种对错误很敏感的方法。
算术编码(Arithmeticcoding),从前面的分析可知,无失真图像压缩编码的平均码长存在一个下限,这就是信源熵。
换句话说,如果无失真图像编码的压缩效率越高,那么编码的平均码长越接近信源的熵。
因此,无失真编码的压缩比不可能很高,而在有限失真图像编码方法中,则允许有一定的失真存在,因而可以大大提高压缩比,压缩比越大,引入的失真也就越大,但同样提出了一个新的问题,这就是在失真不超过某种极限的情况下,所允许的编码比特率的下限是多少,率失真函数回答的便是这一问题。
有限失真图像压缩编码(LossyImageCompression),率失真函数是指在信源一定的情况下使信号的失真小于或等于某一值D所必需的最小的信道容量,常用R(D)表示,D代表所允许的失真,对连续信源的编码与传输,可以用失真度d(x,y)和失真函数D(x,y)表示,即通常采用以下几种失真度量:
(1)均匀误差
(2)绝对误差(3)频域加权误差(4)超视觉阈值均方误差在图7.7中给出了率失真函数R(D)与失真D的关系曲线。
可见对于离散信源,当D=0(即无失真情况下)时,所需的比特数为R(0),并且小于收到信号的熵值H(Y);当D逐渐增大时,所需的率失真函数则随之下降,因此我们可以总结出率失真函数R(D)的性质。
率失真函数(Ratedistortionfunction),图7.7R(D)的典型曲线,率失真函数具有以下性质
(1)当D0时,不存在R(D).(2(当DDmax(Dmax为正值,其数值上等于信号方差2)时,R(D)=0,表示此时所传输的数据信息毫无意义。
(3)当0DDmax时,R(D)是一个下凸型连续函数。
7.3.1、率失真函数(Ratedistortionfunction),率失真函数具有以下性质
(1)当D0时,不存在R(D).(2(当DDmax(Dmax为正值,其数值上等于信号方差2)时,R(D)=0,表示此时所传输的数据信息毫无意义。
(3)当0DDmax时,R(D)是一个下凸型连续函数。
7.3.1、率失真函数(Ratedistortionfunction),7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),1.线性预测编码,目前用得较多的线性预测方法,全称为差值脉冲编码调制(DPCM:
DifferentialPulseCodeModulation),简称为DPCM。
图7.9是一个4阶预测器的示意图,图(a)表示预测器所用的输入像素和被预测像素之间的位置关系,图(b)表示预测器的结构。
图7.8DPCM系统框图,7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),图7.9是一个4阶预测器的示意图,图(a)表示预测器所用的输入像素和被预测像素之间的位置关系,图(b)表示预测器的结构.,图7.9预测像素和预测器,7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),
(1)变换编码的工作原理,图7.11变换编码系统原理,变换编码的工作原理如图所示,7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),变换编码首先将一幅NN大小的图像分割成个子图像。
然后对子图像进行变换操作,解除子图像像素间的相关性,达到用少量的变换系数包含尽可能多的图像信息的目的。
接下来的量化步骤是有选择地消除或粗量化带有很少信息的变换系数,因为它们对重建图像的质量影响很小。
最后是编码,一般用变长码对量化后系数进行编码。
解码是编码的逆操作,由于量化是不可逆的,所以在解码中没有对应的模块,其实压缩并不是在变换步骤中取得的,而是在量化变换系数和编码时取得的。
7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),
(2)基于DCT的图像压缩编码,图像的DCT(离散余弦变换)已在4.6节中阐明DCT具有把高度相关数据能量集中的能力,这一点和傅里叶变换相似,且DCT得到的变换系数是实数,因此广泛用于图像压缩。
下面是用二维离散余弦变换进行图像压缩说明。
例如一个图像信号,其灰度值为,7.3.2线性预测编码和变换编码(LinearPredictionandTransformCoding),得到DCT系数矩阵为,(7.29),由(7.29)式可以看出DCT系数集中在低频区域、越是高频区域系数值越小,根据人眼的视觉特性,通过设置不同的视觉阈值或量化电平,将许多能量较小的高频分量量化为0,可以增加变换系数中“0”的个数,同时保留能量较大的系数分量,从而获得进一步的压缩。
在JPEG的基本系统中,就是采用二维DCT的算法作为压缩的基本方法。
(a)原始图像(b)压缩后的图像,图7.12图像压缩前后的比较,矢量量化(VectorQuantifiation,VQ)技术是一种有损压缩技术,它根据一定的失真测度在码书中搜索出与输入矢量失真最小的码字的索引,传输时仅传输这些码字的索引,接收方根据码字索引在码书中查找对应码字,再现输入矢量。
矢量量化编码(VectorQuantifiationCoding),1.矢量量化原理,矢量量化的过程如图7-13所示,可以分为量化和反量化两部分。
在矢量量化中,根据某种失真最小原则,来分别决定如何对n维矢量空间进行划分,以得到合适的C个分块,以及如何从每个分块选出它们各自合适的代表Xi。
图7.13矢量量化编译码,2.码书的设计,矢量量化中的一个关键问题就是码书的设计。
码书的设计越适合待编码的图像的类型,矢量量化器的性能就越好,因为实际中不可能为每一幅待编码的图像单独设计一个码书,所以通常是以一些代表性的图像构成的训练集为基础,为一类图像设计出一个码书。
图像编码新技术(NewImageCompressionTechnology),7.4.1子带编码(Subbandcoding),7.4.2模型基编码(Model-basedcoding),7.4.3分形编码(Fractalcoding),1.子带编码子带编码是一种在频率域中进行数据压缩的算法。
其指导思想是首先在发送端将图像信号在频率域分成若干子带,然后分别对这些子带信号进行频带搬移,将其转换成基带信号,再根据奈奎斯特定理对各基带信号进行取样、量化和编码,最后合并成为一个数据流进行传送。
子带编码(Subbandcoding),(a)编码器,(b)解码器,图7.15子带编码器工作原理,子带编码的工作原理,7.4.1子带编码(Subbandcoding),)模型基编码主要是一种参数编码方法,因此它与基于保持信号原始波形的所谓波形编码相比有着本质区别。
相对于对像素进行编码而言,对参数的编码所需的比特数要少得多,因此可以节省大量的编码数据。
模型基编码主要依据对图像内容的先验知识的了解,根据掌握的信息,编码器对图像内容进行复杂的分析,并借助于一定的模型,用一系列模型的参数对图像内容进行描述,并把这些参数进行编码传输到解码器。
解码器根据接收到的参数和用同样方法建立的模型可以重建图像的内容。
因此,这类编码器也可称为分析综合编码器,图7.16为其编码原理框图。
7.4.2模型基编码(Model-basedcoding),图7.16分析综合编码器原理图,编码原理,7.4.2模型基编码(Model-basedcoding),在分形编码中,使用了迭代函数(IFS)理论、仿射理论和拼贴定理,具体应用过程如下:
首先采用如颜色分割、边缘检测、频谱分析等,将原始图像分割成一系列子图像,如一棵树、一片树叶然后在分形集合中查找这些子图像,但分形集所存储的并不是具体的子图像,而是迭代函数,因此分形集中包含许多迭代函数。
由于迭代只需要几个参数来表示,因此能够得到高压缩比。
由此可见,分形编码中存在两大难点,这就是如何进行图像分割和构造迭代。
分形编码(Fractalcoding),图像压缩技术标准(ImageCompressionStandards),7.5.1JPEG压缩(JPEGCompression),7.5.2JPEG2000,7.5.3H.26X标准(H.26Xstandards),7.5.4MPEG标准(MPEGstandards),JPEG是用于彩色和灰度静止图像的一种完善的有损/无损压缩方法,对相邻像素颜色相近的连续色调图像的效果很好,而用于处理二值图像效果较差。
JPEG是一种图像压缩方法,它对一些图像特征如像素宽高比、彩色空间或位图行的交织方式等并未作严格的限制。
在JPEG基准编码系统中,输入和输出图像都限制为8比特图像,而量化的DCT系数值限制在11比特。
图7.15给出了JPEG编码/解码方框图。
JPEG压缩(JPEGCompression),7.5.1、JPEG压缩(JPEGCompression),JPEG2000主要由6个部分组成,其中,第一部分为编码的核心部分,具有最小的复杂性,可以满足80%的应用需要,其地位相当于JPEG标准的基本系统,是公开并可免费使用的。
第二至第六部分则定义了压缩技术和文件格式的扩展部分,包括编码扩展(第二部分),MotionJPEG2000(MJP2,第三部分),一致性测试(第四部分),参考软件(第五部分),混合图像文件格式(第六部分)。
7.5.2JPEG2000,图7.18是JPEG2000的基本模块组成,其中包括预处理、DWT、量化、自适应算术编码以及码流组织等5个模块。
7.5.2JPEG2000,7.5.3H.26X标准(H.26Xstandards),1.H.261TU-T(原CCITT)于1990年7月通过H.261建议“p64kbit/s视听业务的视频编解码器”,其中p的范围是130,覆盖了整个窄带ISDN基群信道速率。
该标准的应用目标是会议电视和可视电话,通常p=1,2时适用于可视电话,p在6以上时可以适用于会议电视业务。
2.H.263H.263建议中仍采用H.261建议的混合编码器,但去掉了信道编码部分。
在信源编码器中,DCT、量化器的种类,以及对DCT的量化系数的Z字形扫描和二维VLC等处理与H.261建议是一致的,H.263的基本编码方法与H.261是相同的,均为混合编码方法。
但H.263在编码的各个环节上考虑得更加细致,以便节省码字。
为了能适合极低码率的传输,H.263增加了4个编码的高级选项,这是H.263在技术上显著区别于H.261的地方,这些高级选项的使用进一步提高了编码效率,在极低码率下获得了较好的图像质量。
MPEG是活动图像专家组(MovingPictureExpertGroup)的缩写。
它建立于1988年,属于ISO/IEC信息技术联合委员会第29研究组的第11工作组(JJCISC29,WGll)。
MPEG专家组开始时完成三个工作项目,即压缩码率达15Mbs的MPEGl编码标难;压缩码率达10Mbs的MPEG2编码标准及压缩码率达40Mbs的MPEG3编码标准。
但后来MPEG2的工作内容扩大并包含了MPEG3的内容,l992年7月撤消了MPEG3项目组。
由于甚低码率(verylowbit-rate)的音视频编解码的需要,1993年7月成立了MPEG4,7.5.4MPEG标准(MPEGstandards),ThankYou!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 MATLAB 实现