视频基础知识.docx
- 文档编号:2753498
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:20
- 大小:31.74KB
视频基础知识.docx
《视频基础知识.docx》由会员分享,可在线阅读,更多相关《视频基础知识.docx(20页珍藏版)》请在冰点文库上搜索。
视频基础知识
视频基础知识
多媒体的应用已经深入人们生活,视频会议已经成为工作会议、教学中重要的手段之一。
高清电视、高清视讯也是现在人们茶余饭后的谈资,那么什么是高清的标准?
什么是高清的分辨率?
计算机行业中的显示器与电视行业中的分辨率有什么区别?
为什么视频会议、数字电视在图像采样上采用子采样的方式?
高清视频会议和高清电视是怎么统一起来的?
本文就为你解开视频的层层面纱,深入了解视频会议的基础知识。
1逐行扫描与隔行扫描
隔行(interlaced)和逐行(progressive)都是CRT时代显示器的水平扫描方式。
CRT的每一帧画面都通过电器枪自上而下的扫描来完成。
这一过程中,如果逐一完成每一条水平扫描线,就称作逐行扫描。
如果先扫描所有奇数扫描线,再完成偶数扫描线,就是隔行扫描,每一帧(Frame)图像通过两场(Filed)扫描完成,第一场只扫描奇数行,第二场只扫描偶数行。
图1隔行扫描(左图是奇数场,右图是偶数场)
图2逐行扫描
进入到数字时代,虽然采用液晶、等离子等数字技术的电视机本身不再采用CRT扫描显示方式,但是隔行和逐行却仍然成为高清信号的两种格式。
经常见到的720p、1080i、1080p中的P就是指逐行扫描,I指隔行扫描。
逐行扫描和隔行扫描的特点:
Ø 逐行扫描的图像画面平滑、无闪烁;
Ø 隔行扫描行间闪烁比较明显、会造成锯齿现象,它们是由组成单一帧的两个视场间的相对位移造成的;
Ø 隔行扫描是一种压缩方式,用帧周期一半的时间,通过偏置两个视场来组建一帧,减少了一半需要传输或储存的信息量;对于未被压缩的隔行高清晰度视频,这个数据产生速度大约是前面的两倍。
图3逐行扫描与隔行扫描图像质量对比
2颜色空间
2.1光和颜色
可见光是波长在380nm~780nm之间的电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的。
如果光源由单波长组成,就称为单色光源。
该光源具有能量,也称强度。
实际中,只有极少数光源是单色的,大多数光源是由不同波长组成,每个波长的光具有自身的强度。
这称为光源的光谱分析。
颜色是视觉系统对可见光的感知结果。
研究表明,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞。
红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同。
自然界中的任何一种颜色都可以由R,G,B这3种颜色值之和来确定,以这三种颜色为基色构成一个RGB颜色空间,基色的波长分别为700nm(红色)、546.1nm(绿色)和435.8nm(蓝色)。
颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比),只要其中一种不是由其它两种颜色生成,可以选择不同的三基色构造不同的颜色空间。
图4颜色构成原理
2.2颜色的度量
图像的数字化首选要考虑到如何用数字来描述颜色。
国际照明委员会CIE(InternationalCommissiononIllumination)对颜色的描述作了一个通用的定义,用颜色的三个特性来区分颜色。
这些特性是色调,饱和度和明度,它们是颜色所固有的并且是截然不同的特性。
色调(hue)又称为色相,指颜色的外观,用于区别颜色的名称或颜色的种类。
色调用红、橙、黄、绿、青、蓝、靛、紫等术语来刻画。
用于描述感知色调的一个术语是色彩(colorfulness)。
饱和度(saturation)是相对于明度的一个区域的色彩,是指颜色的纯洁性,它可用来区别颜色明暗的程度。
完全饱和的颜色是指没有渗入白光所呈现的颜色,例如仅由单一波长组成的光谱色就是完全饱和的颜色。
明度(brightness)是视觉系统对可见物体辐射或者发光多少的感知属性。
它和人的感知有关。
由于明度很难度量,因此国际照明委员会定义了一个比较容易度量的物理量,称为亮度(luminance)来度量明度,亮度(luminance)即辐射的能量。
明度的一个极端是黑色(没有光),另一个极端是白色,在这两个极端之间是灰色。
光亮度(lightness)是人的视觉系统对亮度(luminance)的感知响应值,光亮度可用作颜色空间的一个维,而明度(brightness)则仅限用于发光体,该术语用来描述反射表面或者透射表面。
2.3颜色空间
颜色空间是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。
颜色空间中的颜色通常使用代表三个参数的三维坐标来指定,这些参数描述的是颜色在颜色空间中的位置,但并没有告诉我们是什么颜色,其颜色要取决于我们使用的坐标。
从技术上角度区分,颜色空间可考虑分成如下三类:
Ø RGB型颜色空间/计算机图形颜色空间:
这类模型主要用于电视机和计算机的颜色显示系统。
例如,RGB,HSI,HSL和HSV等颜色空间。
Ø XYZ型颜色空间/CIE颜色空间:
这类颜色空间是由国际照明委员会定义的颜色空间,通常作为国际性的颜色空间标准,用作颜色的基本度量方法。
例如,CIE1931XYZ,L*a*b,L*u*v和LCH等颜色空间就可作为过渡性的转换空间。
Ø YUV型颜色空间/电视系统颜色空间:
由广播电视需求的推动而开发的颜色空间,主要目的是通过压缩色度信息以有效地播送彩色电视图像。
例如,YUV,YIQ,ITU-RBT.601Y'CbCr,ITU-RBT.709Y'CbCr和SMPTE-240MY'PbPr等颜色空间。
2.4颜色空间的转换
不同颜色可以通过一定的数学关系相互转换:
Ø 有些颜色空间之间可以直接变换。
例如,RGB和HSL,RGB和HSB,RGB和R'G'B',R'G'B'和Y'CrCb,CIEXYZ和CIEL*a*b*等。
Ø 有些颜色空间之间不能直接变换。
例如,RGB和CIELa*b*,CIEXYZ和HSL,HSL和Y'CbCr等,它们之间的变换需要借助其他颜色空间进行过渡。
其中,R'G'B'和Y'CbCr两个彩色空间之间的转换关系可以用下式表示:
Y=0.299R+0.587G+0.114B
Cr=(0.500R-0.4187G-0.0813B)+128
Cb=(-0.1687R-0.3313G+0.500B)+128
图5色彩空间的变换
Y'CbCr中,Y表示亮度,CbCr表示色差。
Y'CbCr彩色空间的特点:
Ø 亮度信号和色度信号相互独立的 ----可以对这些单色图分别进行编码。
这就是为什么黑白电视能接收彩色电视信号的原因。
Ø 人眼对彩色细节的分辨能力远比对亮度细节的分辨能力低----可以把几个相邻像素不同的彩色值当作相同的彩色值来处理,从而减少所需的存储容量和传输量。
3电视制式
3.1彩色电视制式
目前世界上现行的彩色电视制式有三种:
NTSC制、PAL制和SECAM制。
这里
不包括高清晰度彩色电视HDTV(High-Definitiontelevision)。
1.NTSC制式
NTSC(NationalTelevisionSystemsCommittee)彩色电视制是1952年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。
美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式。
NTSC彩色电视制的主要特性是:
(1)525行/帧,30帧/秒(29.97fps,33.37ms/frame);
(2)高宽比:
电视画面的长宽比(电视为4:
3;电影为3:
2;高清晰度电视为16:
9);
(3)隔行扫描,一帧分成2场(field),262.5线/场;
(4)在每场的开始部分保留20扫描线作为控制信息,因此只有485条线的可视数据;
(5)每行63.5微秒,水平回扫时间10微秒(包含5微秒的水平同步脉冲),所以显示时间是53.5微秒;
(6)颜色模型:
YIQ。
一帧图像的总行数为525行,分两场扫描。
行扫描频率为15750Hz,周期为63.5μs;场扫描频率是60Hz,周期为16.67ms;帧频是30Hz,周期33.33ms。
每一场的扫描行数为525/2=262.5行。
除了两场的场回扫外,实际传送图像的行数为480行。
2.PAL制式
由于NTSC制存在相位敏感造成彩色失真的缺点,因此德国于1962年制定了PAL(Phase-AlternativeLine)制彩色电视广播标准,称为逐行倒相正交平衡调幅制。
德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。
PAL电视制的主要扫描特性是:
(1)625行(扫描线)/帧,25帧/秒(40ms/帧);
(2)长宽比(aspectratio):
4:
3;
(3)隔行扫描,2场/帧,312.5行/场;
(4)颜色模型:
YUV。
3.SECAM制式
法国制定了SECAM(法文:
SequentialColeurAvecMemoire)彩色电视广播标准,称为顺序传送彩色与存储制。
法国、苏联及东欧国家采用这种制式。
世界上约有65个地区和国家试验这种制式。
这种制式与PAL制类似,其差别是SECAM中的色度信号是频率调制(FM),而且它的两个色差信号:
红色差(R'-Y')和蓝色差(B'-Y')信号是按行的顺序传输的。
图像宽高比为4:
3,625线,50Hz,6MHz电视信号带宽,总带宽8MHz。
表1电视制式的比较
制式名
历史
应用
区别
NTSC制(NationalTelevisionSystemsCommittee)正交平衡调幅制
1952年美国国家电视标准委员会定义的彩色电视广播标准
美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式
525行/帧,30帧/秒;隔行扫描;颜色模型:
YIQ
PAL制(Phase-AlternativeLine)逐行倒相正交平衡调幅制
德国(当时的西德)于1962年制定
德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式
625行(扫描线)/帧,25帧/秒;隔行扫描,2场/帧,;颜色模型:
YUV
SECAM制。
(法文:
SequentialColeurAvecMemoire)顺序传送彩色与存储制
法国制定
法国、苏联及东欧国家采用这种制式。
世界上约有65个地区和国家试验这种制式
625行(扫描线)/帧,25帧/秒;隔行扫描
3.2彩色电视的颜色空间
在彩色电视中,用Y、C1,C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关。
在NTSC彩色电视制中,C1,C2分别表示I、Q两个色差信号;在PAL彩色电视制中,C1,C2分别表示U、V两个色差信号;在CCIR601数字电视标准中,C1,C2分别表示Cr,Cb两个色差信号。
所谓色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。
(1)NTSC的YIQ颜色空间与RGB颜色空间的转换关系如下:
Y=0.30R+0.59G+0.11B
I=0.74(R-Y)-0.27(B-Y)=0.60R+0.28G+0.32B
Q=0.48(R-Y)-0.27(B-Y)=0.21R+0.52G+0.31B
(2)PAL的YUV颜色空间与RGB颜色空间的转换关系如下:
Y=0.30R+0.59G+0.11B
U=0.493(B-Y)=-0.15R-0.29G+0.44B
Q=0.877(R-Y)=0.62R-0.52G-0.10B
4视频图像采样
模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。
因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。
模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三个模/数转换器对三个分量分别采样并进行数字化,最后再转换成RGB空间。
对彩色电视图像进行采样时,可以采用两种采样方法。
一种是使用相同的采样频率对图像的亮度信号(Y)和色差信号(Cr,Cb)进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。
如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling)。
由于人的视觉对亮度信号的敏感度高于对色差的敏感度,这样做利用人的视觉特性来节省信号的带宽和功率,通过选择合适的颜色模型,可以使两个色差信号所占的带宽明显低于Y的带宽,而又不明显影响重显彩色图像的
观看。
目前使用的子采样格式有如下几种:
(1)4:
4:
4这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。
(2)4:
2:
2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。
(3)4:
1:
1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
(4)4:
2:
0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
图6图像子采样
5分辨率
在视频会议中和电视系统中提到的图像分辨率、显示设备的分辨率,经常不知道怎么才能说清楚、搞明白;再加上视频会议中的经常提到的CIF格式,电视系统中提到的清晰度、电视扫描线,计算机显示设备提到VGA、XGA等分辨率,直到现在风靡各种媒体报端的720p、1080i和1080p的高清电视,这些五花八门的分辨率都是怎么形成的?
本文就做一个全方位的阐述。
5.1图像分辨率
数码图像有两大类,一类是矢量图,也叫向量图;另一类是点阵图,也叫位图。
矢量图比较简单,它是由大量数学方程式创建的,其图形是由线条和填充颜色的块面构成的,而不是由像素组成的,对这种图形进行放大和缩小,不会引起图形失真。
点阵图很复杂,是通过摄像机、数码相机和扫描仪等设备,利用扫描的方法获得,由像素组成的,典型的是以每英寸的像素数(PPI)来衡量。
点阵图具有精细的图像结构、丰富的灰度层次和广阔的颜色阶调。
当然,矢量图经过图像软件的处理,也可以转换成点阵图。
家庭影院所使用的图像,动画片的原图属于矢量图一类,但经过制作中的转化,已经与其他电影片一样,也属于点阵图一类了。
因此,我们在这里主要讨论由像素构成的点阵图。
(1)像素的含义
虽然人们经常听到“像素”一词,也依稀知道一些含义,但不少人对其确切意义和特点并不清楚。
像素就是组成数字图像的最小单元,即一个一个彩色的颜色点。
像素一词是个外来词,在英文中,像素这个单词Pixels就是由“Picture(图像)”和“Element(元素)”两个单词的词头“Pi-el-”拼合而成的。
是构成图像的元素的意思。
从中文来说,像素这个术语是“图像元素”一词的简称。
一般人都以为像素是一个个的小圆点,但实际上它不是圆的,而是方的。
也就是说,数码图像是由大量微小的彩色小方块按照一定的方式排列起来的。
这种关于像素是方的而不是圆的看法,是一些图像处理软件专家和有关书籍的作者特意明确过,而不是凭空猜测。
如果您在计算机上把一幅图像放得很大,在图形的边缘和有斜线的地方,就可以看见像素了,那是阶梯状或马赛克状的小方块,而不是小圆点。
(2)像素的特性
构成点阵图图像的像素具有如下特性:
①像素关系的独立性:
组成图像的像素具有独立性,即各个像素之间不是互相关联的,改变其中一个像素,不会影响其它像素。
利用这个特性,可以对图像像素进行去像素处理或插补新像素的处理,而不会改变原图像的形貌,但对得到的新图像质量有一下影响。
②像素数量大小的固定性:
一幅图像的像素多少是固定的,构成图像的像素数量并不因为显示图像时的放大或缩小而改变其数量。
一般将像素数量的固定性称作“像素的固定大小”,这种称呼与单个像素尺寸的大小混为一谈,所以在这里我们特意将这个特性强调成“像素数量大小的固定性”。
实际上,作为一个一个的像素块来说,其大小是可以改变的,整幅图像的大小也可以随之改变。
③排列位置的固定性:
像素点的排列位置是固定的,单独的像素点不能随意移动,如果移动像素,将对整幅图像造成完全的破坏。
最典型的例子是利用图像处理软件对画面进行波纹化处理,像素的相对位置改变了,原始图像状态也破坏了。
④像素的位深决定图像的层次:
像素位深是指RGB三原色的比特数(Bit)。
彩色图像中,在R、G、B三个颜色通道中,如果每一种颜色通道占用了8位,即有256种颜色,三个通道就包含了256的3次方的颜色,即1677万种颜色。
对于单独的一种颜色,需要8个字节来记录,对于3种颜色来说,就需要24个字节来记录(8×3=24)。
因此,一般的彩色图像需要24位颜色来表现,成为“真彩色”。
根据需要,也可以使用更低的色位,如256色(三色共占8位)或16位色,或者使用更高的色位,如32位、64位等。
图像分辨率的表达方式也为“水平像素数×垂直像素数”,也可以用规格代号来表示。
不过需要注意的是,在不同的书籍中,甚至在同一本书中的不同地方,对图像分辨率的叫法不同。
除图像分辨率这种叫法外,也可以叫做图像大小、图像尺寸、像素尺寸和记录分辨率。
在这里,“大小”和“尺寸”一词的含义具有双重性,它们都可以既指像素的多少(数量大小),又可以指画面的尺寸(边长或面积的大小),因此很容易引起误解。
由于在同一显示分辨率的情况下,分辨率越高的图像像素点越多,图像的尺寸和面积也越大,所以往往有人会用图像大小和图像尺寸来表示图像的分辨率。
根据像素的特点可以得出下面结论:
图象分辨率和图象尺寸的值一起决定文件的大小及输出质量,该值越大图形文件也越大。
5.2物理分辨率
在视频会议中,会场的图像最终要在电视机或者通过投影仪显示,那么怎么衡量电视的分辨率?
在双流发送的视频会议中,主流发送动态图像,辅流可以传送PC桌面,那么PC显示器的分辨率又怎么衡量?
电视机的分辨率和显示器的分辨率都是物理分辨率,但是叫法不一,这里澄清一下。
5.2.1显示器的分辨率
1、显示器分辨率
指计算机显示器的物理分辨率,即在显示器屏幕上的荧光粉点数或像素数。
过去人们只注意显示器的荧光粉点距,没有注意显示器的荧光粉点数,因此在这里听起来有点不习惯。
但自从有了液晶显示器后,人们就开始熟悉显示器的固有像素点数和显示器本身的分辨率了。
因此,显示器分辨率就是在生产制造时加工出来的显像小单元的数量,这种显像小单元对CRT显示器来说是指屏幕上的荧光粉点,对液晶显示器和等离子显示器来说是指显示屏上的像素。
显示器分辨率的高低,既可以用规格代号表示,如VGA和XGA等,也可以用“水平像素数×垂直像素数”的数字表示,如800×600和1024×768。
但是在实用中,人们往往将显示器分辨率、显示分辨率和屏幕分辨率混为一谈。
因为这3个术语的中文含义十分接近,所以产生这种混乱,但实际上这3者却是有的相同、有的不同,因此我们应当好好注意一下它们的区别。
2、显示分辨率
指进行计算机桌面属性“屏幕分辨率”设置时选用的分辨率,也叫显示属性,它是用来实际显示图像时计算机所采用的分辨率,而与显示器分辨率无关。
显示分辨率既可以小于显示器分辨率,也可以等于或大于显示器分辨率。
这种分辨率有很多格式提供给操作者选择,如从640×480的低规格,直到1600×1200甚至更高的规格。
显示分辨率,与显示器分辨率却不是一回事,显示器分辨率是描述的显示器自身的像素点数量,每台显示器只有一种固有分辨率,它是不可改变的。
显示分辨率的表达方式与显示器分辨率的表达方式相同,也是用分辨率规格代号或“水平像素数×垂直像素数”的数字来表示。
5.2.2电视的分辨率
在电视工业中,分辨率是用清晰度来度量,单位是电视线(TVLine)。
1、人眼的分辨力和电视的清晰度
人眼的分辨力是指人眼对所观察的实物细节或图像细节的辨别能力,具体量化起来就是能分辨出平面上的两个点的能力。
人眼的分辨力是有限的,在一定距离、一定对比度和一定亮度的条件下,人眼只能区分出小到一定程度的点,如果点更小,就无法看清了。
根据人眼的分辨力,决定了影视工作者力求达到的影像清晰度的指标,也决定了采用图像像素的合理值。
人眼分辨图像细节的能力也称为“视觉锐度”,视觉锐度的大小可以用能观察清楚的两个点的视角来表示,这个最小分辨视角称为“视敏角”。
视敏角越大,能鉴别的图像细节越粗糙;视敏角越小,能鉴别的图像细节越细致。
在中等亮度和中等对比度的条件下,观察静止图像时,对正常视力的人来说,其视敏角在1~1.5分之间,观察运动图像时,视敏角更大一些。
为了将研究的对象从两个点扩大到一个面,所以将视敏角从人眼到两个点之间的夹角,引伸到从观察点(人眼)到一定距离的一条相邻黑、白线条之间的夹角。
如果观察的是在垂直方向上排列的一系列连续水平黑白线条,则能表现出图像的垂直清晰度;如果观察的是在水平方向排列的一系列连续垂直黑白线条,则能表现出图像的水平清晰度。
电视正是利用了这个原理,确定出了电视应当设计成具有多高的垂直清晰度和多高的水平清晰度,再从清晰度推算出需要多少条水平扫描线和多少条垂直扫描线,从扫描线又推导出需要多少水平像素和多少垂直像素,也即建立起了相应的图像的分辨率和单幅电视图像的扫描格式,将它再与每秒钟图像的显示次数和其它指标结合起来,最终建立起了相应的电视制式。
2、垂直清晰度
上面已经提到过,根据视敏角原理,人眼能辨别在垂直方向上排列的相邻黑白水平线条的细致程度叫垂直清晰度,但是怎么来鉴别和量度这个细致程度呢?
假设画面高度为H,在垂直方向上有M条黑白相间、具有一定宽度的水平线条,每条水平线条在垂直方向上的宽度为h。
如果人眼在距离为L处刚好可以分辨清楚这些水平线条,则视敏角θ可表示为:
θ=h/L(弧度)
因为每条线对的宽度为
h=H/M
则有
θ=H/(LM)(弧度)
将弧度化为角度后,则为
θ=3438H/(LM)(分)
也就是
M=3438(H/L)(1/θ)
试验表明,观看图像的最佳距离应当是画面高度的4倍至5倍,这时的总视角约为15度,在这种情况下,可以保证人眼不转动就能看到完整的画面。
这个距离,既可以避免因过近观看时眼球需要不停地转动而引起眼疲劳,又可以避免过远观
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视频 基础知识