多媒体技术概念.docx
- 文档编号:4414710
- 上传时间:2023-05-07
- 格式:DOCX
- 页数:43
- 大小:40.84KB
多媒体技术概念.docx
《多媒体技术概念.docx》由会员分享,可在线阅读,更多相关《多媒体技术概念.docx(43页珍藏版)》请在冰点文库上搜索。
多媒体技术概念
第一章多媒体技术概念
一、多媒体技术的形成和发展
多媒体技术的应用始于20世纪80年代
(一)相关概念
文本、声音、图形、图象和动画等是信息载体,其中两个或两个的组合构成了多媒体。
多媒体计算机技术就是指运用计算机综合处理多媒体信息(文本、声音、图形、图象和动画等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统等等。
1、促进多媒体技术发展的关键技术是:
(1)、CD-ROM解决了多媒体信息的存储问题。
(2)、高速计算机网络可以传送多媒体信息。
(3)、高速位处理技术、专用集成电路技术和亚微米集成电路技术的发展
(4)、多媒体压缩技术、人机交互技术和分布式处理技术。
2、多媒体技术的特性
(1)集成性:
包括两方面,一方面是将各种不同的媒体信息有机地进行同步组合成为一个完整的多媒体信息。
另一方面是把不同的媒体设备集成在一起。
(2)实时性
(3)交互性
(4)高质量
(二)、多媒体技术的发展
1、启蒙发展阶段
1983年,美国无线电公司RCA的研究中心,推出交互式数字视频系统DVI
1984年,美国APPLE公司最早用GUI(图形用户接口)取代CUI(计算机用户接口)
1985年,美国COMMODORE公司推出世界上第一台多媒体计算机Amiga
1986年3月,荷兰Philips公司和日本Sony公司联合研制并推出交互式紧凑光盘系统CD-I(compactdiscinteractive)
20世纪90年代,微软公司为了改善人机界面推出Windows3.0操作系统
2、初期应用和标准化阶段
20世纪90年代以来,应用广泛,范围包括培训、教育、商业、简报和产品展示、产品和事物咨询、信息出版、销售演示,家庭教育和电子商务等领域。
多媒体的标准化是在最广泛的信息基础上制定的,代表先进的技术,标准化是众多研究单位长期研究开发和生产厂家相结合的结果,具有兼容性、通用性;发展阶段如下:
1990年10月,形成了多媒体PC机技术规范1.0简称标准1
1993年,建立了多媒体微机的性能标准2,其能与原有的MPC标准兼容。
多媒体技术应用的关键问题是对图象进行压缩编码和解压。
国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)两家联合成立了专家组JPEG(Jointphotographicexpertsgroup),致力于建立适用彩色和单色,多灰度连续色调,静态图象的数字图象压缩国际标准,于1999年委员会提出了ISO/IEC10916G标准,即“多灰度静止图象的数字压缩编码”。
1992年,运动图象专家组(Movingpictureexpertgroup,又称MPEG)提出了MPEG-1(用于数字存储多媒体运动图象,起伴音速率为1.5Mbps)的压缩解码作为ISOCDII72号标准,用于实现全屏幕压缩编码及解码,它由三部分组成,包括MPEG视频,MPEG音频,MPEG系统。
IBM于1993年6月举行的PC展览会上,公布了针对台式系统用户,在OS/22.1上运行的32位多媒体软件包,内容包括:
(1)Mutimediabuilder,它使用户能做出图象和静止图形在内的多媒体应用软件
(2)Mutimediaworkplace,是一个收索软件,使用户能按颜色,声音或指定图象在内任意多的文件中收索并观看特定文件。
(3)Mutimediaimage它使用户能在各种资源中获取图象加以修饰,或加入其他文件。
(三)、我国多媒体的发展现状
我国多媒体的技术和应用的发展始于20世纪80年代末,大致分为以下几个阶段:
1、1989年开始,主要集中在多媒体应用系统的开发上,如声频卡,视频卡
2、开始注意创建自己的开发平台,著作工具和编辑软件,甚至开发声频卡,视频卡等硬件
3、从1992年初开始,我国多媒体研究逐渐广泛。
4、1993年后,随着应用水平的提高,竞争的激烈,应用得到推广,技术水平也不断提高。
5、1994年下半年,MPEG及JPEG技术及有关产品的推广,多媒体技术在国内迅速发展。
二、多媒体系统的分类
(一)、基于功能的分类
1、开发系统2、演示系统3、培训系统4、家庭系统
(二)、基于应用的分类
1、多媒体信息咨询系统2、多媒体管理系统3、多媒体辅助教育系统4、多媒体通信系统5、多媒体娱乐系统
(三)多媒体系统的组成
1、计算机硬件:
是系统的基础
2、多媒体实时压缩与解压:
通过配置的硬件,对视频和音频的适时压缩和解压缩音频信号I/O接口卡
3、多媒体I/O控制及接口:
是多媒体的桥梁
4、多媒体的核心系统
5、创作系统:
包括开发工具、具有编辑、播放等功能。
6、应用系统:
利用创作系统制作的多媒体应用系统
多媒体的配置根据应用不同也不同:
除了基本配置还可配置触摸屏、话筒、摄象机、录象机、扫描仪等输入输出设备,可读写光盘。
声音的获取:
多媒体系统从话筒中获取声音,利用脉冲编码调制PCM(pulsecodemodulation)技术,将声音数字化后存储到计算机文件中。
PCM的两个要素:
(1)采样速率:
是声音从模拟波形转化为数字数据的速度,采样速率决定着声音记录和生成的最高频率。
(2)样本大小:
采样速率必须比样本的最高频率的两倍再高约10%,人类的听力的范围大约从20HZ到20KHZ,因此激光唱盘的抽样速率应为44.1KHZ。
如:
样本大小:
表示用来存储记录下来的声音振幅的位数,样本大小决定着声音的动态范围。
多媒体PC的最低标准要求样本大小8位,单声道采样速率为11.025KHZ,每秒需要存储量为11025字节,每分钟为11025*60=661500字节。
若要达到激光唱盘的质量,采样速率为44.1KHZ,样本大小为16位,立体声,则:
1秒钟即为:
4400*2*2=176400字节
1分钟即为:
176400*60=10584000字节
由此可以看出波形声频文件较大,要将这些声频波形从相应的硬件中重放出来,因此这也是MPC标准中规定光盘驱动器必须支持150Kbps连续传输速率的原因之一。
图象要求的存储量更大,如分辨率300dpi时,一幅静止A4幅面的黑白图象,数据量可达到1Mb,又如我国彩电制式为PAL-D,场频50HZ,625行,屏幕宽高比为4/3,采用隔行扫描,则一幅静止画面含有:
(625*(4/3)*625)/2=260000个像素,如将每个像素采样量化成24位,则每场画面的信息量树为:
260000*24b=6240000b=6.24M,传送数据的速率可高达6.24M*50Mbps=312Mbps,数据量相当大,所以若将电视画面存储在多媒体系统中,用1GB的光盘只能存储3秒钟左右的图象,因此不仅要求很大的存储量,同时又必须对图象进行动态和静态(JPEG,MPEG)压缩。
(四)、局域网
一、定义与功能:
局域网LAN就是将局部建筑物的计算机、终端,带大容量存储器的外围设备、控制器、显示器以及连接其他网络而使用的网络连接器等相互连接起来,以较高的速率(1-20Mbps)进行通信。
局域网由三部分组成:
计算机及智能型外围设备、网络接口卡及电缆、网络操作系统及有关软件。
局域网从应用角度,有如下功能:
(1)设备共享
(2)信息共享(3)可进行高速数据通信和多种媒体信息的通信
(4)分布式处理(5)提高兼容性(6)安全性
二、局域网应用关键技术
(1)通信技术:
传输介质、局域网的拓扑结构、信息传输方式及信号变换方式
(2)局域网的访问控制方式和通信协议
(3)网络操作系统(NOS):
是局域网的核心,特性有
(1)硬件独立
(2)桥连接(3)能支持多个服务器(4)多用户支持(5)网络管理(6)安全性及存取控制(7)用户界面
(五)广域网
一、定义:
广域网(WAN)是在较大的地理范围内将计算机连起来的计算机网络,与局域网比,传输速度为每秒数千位的速度进行通信,并且必须使用调制解调器(MODEM)来转换模拟信号和数字信号。
(六)因特网
1、因特网的发展
internet代表着全球范围内一组无限增长的信息资源,是美国国防部在其高级研究计划中的一个关键思想,将LAN和WAN连接起来成为互连网(internetwork),缩写为internet,我国是加入internet的第71个国家。
2、internet提供的服务方式:
分为基本服务和扩充服务两种。
(1)基本服务:
指TCP/IP协议所包括的基本功能,主要有三种:
电子邮件,文件传输、远程登录
(2)扩充服务:
在TCP/IP协议基本功能的支持下,由某些专用的应用软件或用户接口提供的接口方式,主要有四类:
基于电子邮件的服务有:
电子公告版,新闻群组,电子期刊
(3)名录服务:
分为黄页服务和白页服务
(4)索引服务
(5)交互式服务。
第二章多媒体信息的表示
多媒体数据具有以下特点:
(1)数据量巨大
(2)数据类型多
(3)数据类型间区别大
(4)多媒体数据的输入和输出复杂
多媒体数据的输入方式分为:
多通道异步输入方式和多通道同步方式
(一)、文字
文字是人与计算机之间进行信息交换的主要媒体,包括西文与汉字。
一、西文:
在计算机中,西文采用ASCII码表示,ASCII(americanstandardcodeforinformationinterchange,即美国信息交换标准代码,它是由一个由7个二进制组成的字符编码系统,包括大小写字母,标点符号,阿拉伯数字,数学符号,控制字符等共128个字符。
如字符A的ASCII码值为065。
汉字
1、汉字的输入编码,当前主要采用以下三类方法
(1)数字编码:
国际区位码
(2)拼音码:
全拼音
(3)字型编码:
五笔
2、汉字内码
汉字内码是用于汉字信息的存储,交换,检索等操作的机内代码,一般采用两个自己表示。
3、汉字字模码
字模码是用点阵表示的汉字字形代码,是汉字的输出形式。
注意:
汉字的饿输入编码,汉字内码,字模码是计算机中用于输入,内部处理,输出三种不同用途的编码,不能混为一谈。
(二)音频
音频(Audio)指的是大约在20HZ-20KHZ的频率范围,主要分为波形声音,语音和音乐。
1、数字音频
数字音频是指音频信号用一系列的数字表示,特点是保真度好,动态范围大。
音频数字化是把模拟音频信号转化成数字信号,要考虑采样,量化和编码的问题。
一个音频信号转换成在计算机中的表示过程如下:
(1)选择采样频率,进行采样
(2)选择分辨率,进行量化
(3)形成声音文件
对于音频的数字化来说,在相同条件下,立体声比单声道占的空间大,分辨率越高则占的空间越大,采样频率越高则占的空间越大,总之,对于音频数字化要占用很大的空间,因此,对音频数字化进行压缩是十分必要的。
常用的文件格式主要有:
WAV,VOC,MIDI,AIF,SNO,RMI等。
2、乐器数字接口(MIDI)
MIDI是乐器数字接口的英文缩写,于80年代提出来,是数字音乐的国际标准。
MIDI信息实际上是一段音乐的描述,当MIDI信息通过一个音乐或声音合成器进行播放时,该合成器对一系列的MIDI信息进行解释,然后产生相应的一段音乐或声音。
(1)MIDI文件
(2)MIDI作品
3、数字化声音和MIDI的比较
数字化的声音是声音的实际表示,代表了声音的瞬时幅度,与设备无关,而MIDI数据是与设备有关的,MIDI文件小,而数字化的声音较大。
(1)MIDI数据优点
(2)MIDI数据缺点
(3)MIDI与数字化声音的比较选择
(三)视觉媒体
定义:
是指能够利用视觉传递信息的媒体,包括如:
位图图象、矢量图象、动态图象、符号等。
(1)位图图象:
指在空间和亮度上已经离散化的图象,适用于逼真照片或要求精细的图象,像素是构成一幅位图图象中一个点,与所对应矩阵中的任一元素,相应的值表示该点的灰度或颜色等级。
1、位图的概念:
是一个用来描述像素的简单的信息矩阵。
2、位图的产生方法
3、位图的处理
4、图象压缩
5、图象优化
(2)矢量图形:
指用一个指令集合来描述。
这些指令包含有直线、矩形、圆、圆弧、曲线等形状,位置、颜色等各种属性和参数。
(3)矢量图与位图的比较
1、空间:
矢量图小,位图大
2、性能:
对于复杂的图象,用位图比用矢量图处理快
(四)监视器与颜色
监视器上默认为640*480像素,通常每英寸约有72个点或像素,每个像素可用2的8次方种颜色表示。
1、监视器的分辨率分为三种
(1)、屏幕分辨率
(2)、图象分辨率
(3)、像素分辨率
2、颜色
颜色是多媒体的重要组成部分,通过红蓝绿光敏感来调节这三种颜色的组合成分使人的眼睛和大脑来感受到各种颜色。
计算机中的颜色是心理上的,而不是实际频谱的真实频率。
常用的颜色模型有:
RGB、HSB、HSL、CMYK,CIE等。
(五)图象文件格式
Windows使用设备无关位图(DIB)作为其通用的图象文件格式,它可独立,也可隐藏在一个叫“资源交换格式(RIFF)”的文件中,常用的图象文件格式是DIB,BMP,PCX和TIFF。
(四)动画(Animation)
定义:
是指运动的画面,在多媒体中是一种非常有用的信息交换工具。
它始于20世纪60年代初期,二维动画,三维动画始于70年代,到90年代,动画技术成功的应用与电影特技,并取得出色成就。
1、视觉暂留:
在观察过物体后,物体的映象将在人眼的视网膜上保留一短暂的时间。
而动画正是利用此特性,故,每秒24帧,一系列逐渐变化的图形就可以形成动感。
2、造型动画和帧动画
造型动画:
是对每一个活动的对象分别进行设计并构造每一对象的特征,然后用这些对象组成完整的画面。
帧动画:
是由一幅幅连续的画面组成的画像或图形序列,是产生各种动画的基本方法。
3、技术参数
(1)、帧速度:
25帧/秒-30帧/秒
(2)、数据量:
帧速度乘以每幅图象的数据量
(3)、图象质量:
与压缩的倍数有关
五、超文本与超媒体
一、基本概念:
1、超文本(Hypertext):
不是顺序的,而是一个非线性的网状结构,它把文本按其内部固有的独立性和相关性分成不同的基本信息块,称之为结点。
2、超文本系统:
有如下特点
(1)、在用户界面中包括对超文本的网络结构的一个显示表示
(2)、向用户给出一个网络结构动态图
(3)、在超文本系统中一般使用双向链
(4)、用户可以通过联想及感知,根据需要动态地改变网络中的结点和链
(5)、尽可能不依赖于它的具体特性,命令或信息结构
3、超媒体:
是多媒体加上超文本
二、超文本的主要成分
主要成分是结点和表示结点间关系的链构成的信息网络
1、结点:
是超文本表达信息的一个基本单位,其大小可变,内容不定。
在超文本系统中,把结点分成不同类型,分类如下:
(1)、文本结点
(2)图形结点(3)图象结点(4)声音结点(5)视频结点(6)混合媒体结点(7)按钮结点(8)索引文本结点(9)索引结点(10)对象结点(11)规则结点
2、链:
是组成超文本的基本单位,形式上是从一个结点指向另一个结点的指针,表示不同结点存在的信息的联系。
(1)链的结构:
三部分组成:
链源、链宿及链的属性
(2)链的类型:
在超文本系统中,应该根据具体的情况选用结点类型和链类型,链一般分为如下几种:
1)基本链2)移动链3)缩放链4)全景链5)视图链6)索引链7)Is_a链8)Has_a链9)蕴含链10)执行链
三、超文本系统的结构
1988年,Campbell和Goodman提出了超文本体系结构的三层模型理论:
用户接口层;超文本抽象机层;数据库层
1、数据库层:
是三层模型的最低层,它涉及所有的有关信息存储的问题
2、超文本抽象机层:
是中间层,位于数据库层和用户接口层之间
3、用户接口层:
也称表示层或用户界面层,是最高层
常用的三种接口风格:
菜单选择方式,命令交互方式,图示引导方式
第三章
在多媒体信息中包含大量冗余的信息,把这些冗余的信息去掉,就实现了压缩.
数据压缩技术有三个重要指标:
信息存储量之比;压缩的算法;还原恢复效果
(1)一帧画面是由若干个像素组成的,在每一帧内的相邻像素之间相关性很大,有很大的信息冗余量,即空域相关。
(2)在相邻之间也存在很大的信息冗余量,这就是时域相关。
(3)在多媒体应用中,信息的主要接受人是人,而人的视觉有视觉掩盖效应,即对图象边缘急剧变化反应不灵敏。
数据压缩技术有三个重要指标:
一是信息存储量之比,二压缩的算法,三是恢复效果
一数据压缩的基本原理:
目前常用的压缩编码方法分为两类:
一类是冗余压缩法,也称为无损压缩法熵编码,另一类是熵压缩法,也称有损压缩法.
1变长编码
变长编码使用长度可变的代码对以不同频率出现的样本进行编码,它主要用于消除代码冗余.如
(1)Huffman编码2)算术编码
2预测编码
(1)差分脉冲编码调制(DPCM)
(2)自适应差分脉冲调制
3变换编码:
指对信号进行变换后,再编码.
4模型编码:
指采用模型的方法对传输的图象进行参数估测.典型的模型编码有随机马尔可夫场和分形图象编码.
1)分形的概念
2)分形编码
二音频信号的压缩编码
音频信号是多媒体信息的重要组成部分,音频信号可分为电话质量的语音、调幅广播质量的音频信号和高保真立体声信号。
1音频信号编码基础
1)时域冗余度
2)频域冗余度
3)人的听觉感知机理
4)音频信号编码的分类
2音频信号的压缩编码+算法
1)基本原理
2)脉冲编码调制(PCM
3)线形预测编码(LPC)
4)自适应预测编码(APC)
5)频域编码
6)混合型编码
3音频信号压缩编码标准及质量评估
1)音频信号压缩编码标准
(1)G.711标准
(2)G.721标准
(3)G.722标准
(4)G.728标准
(5)MPEG中的音频编码
2)音频信号编码的质量及其评估
3视频信号的压缩编码
用计算机存储和显示静止或活动图象是多媒体关键技术之一,实时编辑处理和存储显示数兆节活动图象必须要将实时数字图象处理和图象压缩处理技术相结合才能实现。
第四章多媒体的制作
多媒体数据制作的基本方法
多媒体应用系统的开发一般包括下列几个步骤:
1)确定使用对象
2)明确开发方法
3)准备多媒体数据
4)集成一个多媒体应用系统
多媒体技术:
1)用户不使用鼠标和键盘,而通过直接触摸屏幕来获取信息的要求
2)系统需要语音,音乐
3)数据类型中有图象,视频,动画,字幕的要求等.
系统的开发方法:
1)由开发人员全部通过编码来实现一个多媒体应用系统
2)使用已有的多媒体开发平台或开发系统来实现
一数字音频的制作
1音频的录制,编辑和播放
1)音频概述:
声音是以波形的方式被记录下来,可用数学公式,数字序列或图形等表示方法,为了保证数字化以后原来的声音不失真,要考虑下述两方面因素
(1)采样频率
(2)量化精度
2音频的录制和编辑
音频的准备工作包括:
选择音源,录制数字音频,音频的编辑和存储,以及选择音频播放的硬件.
(1)选择音源
(2)录制数字音频
产生失真的原因及解决方法如下:
(1)信号频带宽,但采样频率不够高,数字音频信号发生混叠
(2)模拟音频信号幅度太大,超过了量化器范围
3波形文件编辑
编辑工作包括剪切掉在数字音频文件后,不需要的部分,调整音量,制作音频效果等.常用的软件有:
Vedit21Quickrecorder软件waveedit工具Audioeditor工具
4音频的播放
windows提供了不同层次的多种音频服务
1)在高层音频服务,仅需调用一个函数就能播放和录制音频文件,函数如:
messageBeep/sndplaysound
2)windows的媒体控制接口(MCI)提供高层接口来控制内部和外部媒体设备
MCI提供两类接口:
即命令消息接口和命令字符串接口
2Audioeditor在音频录制和编辑中的应用
该软件是uleadmediastudiopro5的一个实用软件,是一个在windows环境下录制,播放和编辑声音波形文件的应用软件.(参考书上83页-97页)
3MIDI音乐制作
MIDI是多媒体计算机系统产生声音的一种主要方式,适用于长时间音乐演奏的场合,且是多媒体音频的重要组成部分
1)MIDI标准
(1)GeneralMIDI标准
(2)MIDI端口
(3)MIDI消息与MIDI通道
(4)MIDI设备
(5)Omni和poly模式
(6)音色与音数
(7)MIDI控制器与MIDI音源
(8)音序器
(9)音轨
(10)MIDI文件
2)MIDIMapper标准
(1)MIDIMapper:
是将MIDI文件中的音色号和按键号等从标准的generalMIDI排列映射到用户使用的各种特殊MIDI设备,以便程序使用.
(2)MIDIMapper的使用
3)cakewalk在MIDI文件的播放,录制及编辑中的应用(参考书上100-111页)
二数字图象的制作
在多媒体应用系统的开发者来说,将模拟信号转换数字化采样后,还应对视频文件进行编辑或加工,然后才能在多媒体应用系统中使用.
常见视频处理文件软件有:
Adobepremiere,Videoforwindows和Digitalvideoproducer等
1Adobepremiere:
是Adobesystem公司推出的一种专业化数字视频处理软件,它可配合多种硬件进行视频捕获和输出,并提供各种精确的视频编辑工具,能产生广播级质量的视频文件.
1)premiere的基本功能
(1)可实时采集视频信号,采集精度取决于视频卡和PC机的功能
(2)将多种媒体数据综合处理为一个视频文件
(3)具有多种活动图象的特技处理功能
(4)可以配音或叠加文字和图象
2)Adobepremiere的使用方法(参考书上112-126页)
三动画制作
随着复杂光照,纹理模拟和动画控制技术和三维几何造型技术的迅速发展,使得计算机三维动画技术发展很快,较流行的三维动画软件有3DstudioMAX和3DF/X
13DstudioMAX概述
3DstudioMAX以其友好方便的界面,简易快捷的操作,细腻的画面,出色的渲染等特色,为用户提供了一种具有专业水准的三维动画制作软件
23DstudioMAX的使用方法(参考书上127-146页)
第五章多媒体开发环境和工具
一,概述
多媒体创作系统又称作多媒体著作系统,多媒体写作系统或多媒体编辑软件
1多媒体创作系统的功能
(1)视频图象的制作
(2)动画制作
(3)交互式演示系统
(4)展示系统
(5)交互式查询系统
(6)交互式的训练
(7)仿真,原型和技术的可视化
2多媒体创作系统的组成
多媒体创作系统大致可分为素材库,编辑,播放三部分
(1)素材库主要提供各种素材
(2)编辑部分完成大部分的创作工作
(3)播放部分的作用是把应用程序播放出来,以便观察效果,并进行适当调整
二多媒体开发工具类型与功能
1类型:
基于多媒体创作工具的创作方法和结构特点的不同,可将其划分为如下几类:
(1)基于时间的创作工具即各种成分和事件按时间路线组织;如Director和Action
(2)基于图标或流线的创作工具,即按一定流程线,供放置不同类型的图标使用,素材的展现是以流程
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 概念