温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
6.2
多媒体基础
多媒体
基础
您现在的位置:希赛网云阅读软件设计师考试考前串讲考点分析第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日考点分析上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日多媒体基础第10章多媒体基础在软件设计师考试中,有关多媒体基础方面的试题,每次考试的分数基本固定在3分左右。10.1考点分析本节把历次考试中多媒体基础的试题进行汇总,得出本章的考点,如表10-1所示。表10-1多媒体基础试题知识点分布根据表13-1,我们可以得出多媒体基础的考点主要有:(1)多媒体基础:主要考查多媒体的概念、多媒体计算机、多媒体的分类等。(2)压缩编码技术:包括JPEG和MPEG等。(3)音频数据:包括声音采样、声音文件的格式等。(4)颜色空间:包括颜色的属性、分辨率、图形等。(5)视频数据:包括各种动画、视频文件格式等。对这些知识点进行归类,然后按照重要程度进行排列,如表10-2所示。其中的星号(*)代表知识点的重要程度,星号越多,表示越重要。表10-2多媒体基础各知识点重要程度在本章的后续内容中,我们将对这些知识点进行逐个讲解。版权方授权希赛网发布,侵权必究10.2多媒体基础上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日多媒体计算机上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日媒体的分类多媒体技术主要是指文字、声音和图像等多种表达信息的形式和媒体,它强调多媒体信息的综合和集成处理。多媒体技术依赖于计算机的数字化和交互处理能力,它的关键技术是信息压缩技术和光盘存储技术,它的关键特性包括信息载体的多样性、交互性和集成性三个方面。版权方授权希赛网发布,侵权必究10.2.1多媒体计算机多媒体计算机的主要硬件除了常规的硬件如主机、软盘驱动器、硬盘驱动器、显示器、网卡之外,还要有音频信息处理硬件、视频信息处理硬件及光盘驱动器等部分。(1)音频卡用于处理音频信息,它可以把话筒、录音机、电子乐器等输入的声音信息进行模数转换(A/D)、压缩等处理,也可以把经过计算机处理的数字化的声音信号通过还原(解压缩)、数模转换(D/A)后用音箱播放出来,或者用录音设备记录下来。(2)视频卡用来支持视频信号(如电视)的输入与输出。(3)采集卡能将电视信号转换成计算机的数字信号,便于使用软件对转换后的数字信号进行剪辑处理、加工和色彩控制。还可将处理后的数字信号输出到录像带中。(4)扫描仪将摄影作品、绘画作品或其他印刷材料上的文字和图像,甚至实物,扫描到计算机中,以便进行加工处理。(5)光驱分为只读光驱(CD-ROM)和可读写光驱(CD-R,CD-RW),可读写光驱又称刻录机。用于读取或存储大容量的多媒体信息。版权方授权希赛网发布,侵权必究10.2.2媒体的分类媒体可分为感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体。(1)感觉媒体:直接作用于人的感官,产生感觉(视、听、嗅、味、触觉)的媒体,例如:语言、音乐、音响、图形、动画、数据、文字等都是感觉媒体。(2)表示媒体:表示媒体是指用来表示感觉媒体的数据编码。如图像编码(JPEG、MPEG)、文本编码(ASCII码、GB2312)和声音编码等。感觉媒体转换成表示媒体后,能够在计算机中进行加工处理和传输。(3)表现媒体:表现媒体是指进行信息输入或输出的媒体。如键盘、鼠标、扫描仪、话筒、数上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日存储媒体上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日同步化多媒体集成语言码相机、摄像机为输入表现媒体,显示器、打印机、扬声器、投影仪为输出表现媒体。(4)存储媒体:存储媒体是指用于存储表示媒体的物理实体。如硬盘、软盘、光盘等。(5)传输媒体:传输媒体是指传输表示媒体(即数据编码)的物理实体。如电缆、光缆等。版权方授权希赛网发布,侵权必究10.2.3存储媒体目前存储多媒体信息的介质除了磁盘外,主要是光盘。光盘存储器是利用激光束在记录表面存储信息,根据激光束的反射光来读出信息。光盘存储器主要有CD、CD-ROM、CD-I、DVI、WORM、DVD以及EOD(ErasableOpticalDisk)。CD-ROM的读取目前有三种方式:恒定角速度、恒定线速度和部分恒定角速度。CD-ROM非常适用于把大批量数据分发给大量的用户。与传统磁盘存储器相比,有以下优点:具有更大的容量,可靠性高,光盘的复制更简易,可更换,便于携带。其缺点是只读,存取时间比较长。DVD-ROM技术类似于CD-ROM技术,但是可以提供更高的存储容量。DVD通过减小读取激光波长,增大光学物镜数值孔径来达到提高存储容量的目的。DVD可以分为单面单层、单面双层、双面单层和双面双层四种物理结构。DVD与CD/VCD的主要技术参数比较如表10-3所示。表10-3DVD与CD/VCD的主要技术参数比较版权方授权希赛网发布,侵权必究10.2.4同步化多媒体集成语言上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日压缩编码技术上一节本书简介下一节同步化多媒体集成语言(SynchronizedMultimediaIntegrationLanguage,SMIL)是由W3C组织规定的多媒体操纵语言。SMIL与网页上用的HTML的语法格式非常相似。后者主要针对普通的网络媒体文件进行操纵(文字、图片、声音、动画、视频的机械堆砌),而前者则操纵多媒体片断(对多媒体片断的有机的、智能的组合)。SMIL语言是一套已经规定好的而且非常简单的标记。它用来规定多媒体片断在什么时候、在什么地方、以什么样的方式播放。SMIL的主要优点体现在以下几个方面:(1)避免使用统一的包容文件格式。因为多媒体文件的格式非常多,如果我们想在本地机器上直接播放或者在网络上用流媒体的方式来播放若干类文件。以前唯一可行的办法就是用多媒体的编辑软件把这些多媒体文件整合成一个文件,这就必须统一使用某种文件格式。如果用SMIL来组织这些多媒体文件,那么可以在不对源文件进行任何修改的情形下,获得我们想要的效果。(2)同时播放在不同地方(服务器上)的多媒体片断。假如我们现在想把一段电视采访的实况(视频文件)加上解说(包括声音解说(音频文件)和文字解说)。姑且假定例子中的视频文件是甲服务器上的A文件,音频文件是乙服务器上的B文件,而解说文字却是丙服务器上的C文件。传统的方法在这里就束手无策了,而SMIL可以非常轻松的做到这一点。(3)时间控制。如果我们不想用整个视频文件,而只想用其中的某一部分。传统的方法中唯一可行的就是用剪辑软件来剪辑,而SMIL可以规定播放的任意时间段。(4)对整个演示进行布局。一般情形下,在一个区域(屏幕的上部)播放视频,在另一个区域显示文字(屏幕的底部)。而使用SMIL,我们可以随意让文字显示在哪个区域。(5)多语言选择支持。如果一个视频文件需要让不同国家的人播放,传统的方法就是准备不同语言版本的媒体文件,让用户来选择,然后从服务器上下载相应的版本。如果把这些版本用SMIL组织起来、规定好,那么SMIL语言将根据具体的语言设置来播放相应版本的视频。(6)多带宽选择支持。由于各个用户连接到Internet的方式不尽相同,所以其连接的速度差别也较大。为了让他们都能够看到同一个演示,我们可以制作适应不同传输速度的演示。在传统的方法中,往往要用户自己选择他的机器连接所对应的传输速度,然后播放相应的演示文件。使用SMIL播放器检测出用户的连接速度后,就同服务器协商,要求传输并播放相应的演示文件。版权方授权希赛网发布,侵权必究10.3压缩编码技术本节主要介绍数据压缩的相关技术和标准。对于多媒体数据压缩算法而言,数据质量是压缩的效果,数据量是压缩的能力,计算复杂度是压缩的代价,这都需要综合考虑。版权方授权希赛网发布,侵权必究第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日数据压缩的基础上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日数据压缩技术的分类10.3.1数据压缩的基础数据之所以能够压缩,是因为基本原始信源的数据存在着很大的冗余度。一般来说,多媒体数据中存在以下种类的数据冗余。(1)空间冗余(几何冗余):一幅图像的背景及其景物中,在某点自身与其相邻的一些区域内,常存在有规则的相关性。例如:一幅蔚蓝的天空中漂浮着白云的图像,其蔚蓝的天空及白云本身都具有较强的相关性,这种相关性的图像部分,在数据中就表现为冗余。空间冗余是视频图像中常见的一种冗余。(2)时间冗余:对于电视动画类的图像,其序列中前后相邻的两幅图像之间呈现较强的相关性,这就反映为时间冗余。如某一帧图像经过t时间后,在某下一帧图像中带有较强的相关性(即画面像素相似)。(3)知觉冗余:知觉冗余是指那些处于人们听觉和视觉分辨率以下的视、音频信号,若在编码时舍去这种在感知门限以下的信号,虽然这会使恢复原信号产生一定的失真,但并不能为人们所感知,为此,此种超出人们感知能力部分的编码就称为知觉冗余。例如:一般的视频图像采用28的灰度等级,而人们的视觉分辨率仅达26的等级,此差额即为知觉冗余。(4)信息熵冗余:信息熵是指一组数据所携带的信息量。它一般定义为:其中N为数据类数或码元个数,Pi为码元Yi发生的概率。由定义,为使单数据量d接近于或等于H,应设:其中b(yi)是分配给码元Yi的比特数,理论上应取b(yi)=-log2pi,实际上在应用中很难估计出p0,p1,,pn-1.因此一般取这样所得的d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余。(5)结构冗余:有些图像从大的区域上看存在着非常强的纹理结构,例如:布纹图像和草席图像,我们说它们在结构上存在冗余。(6)知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如:人脸的图像有固定的结构,比如,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到,此类冗余称为知识冗余。版权方授权希赛网发布,侵权必究上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日数据压缩标准10.3.2数据压缩技术的分类数据压缩技术可以分为两大类:一类是无损压缩编码法,也称为冗余压缩法、熵编码法;另一类是有损压缩编码法,也称为熵压缩法。无损压缩法去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中,因此是可逆的,也是无失真压缩。它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等,它的压缩比较低,通常是2:15:1之间。有损压缩法压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类。特征抽取包括基于模式的编码、分形编码等;量化包括零记忆量化、预测编码、直接映射、变换编码等方法。其中预测编码和变换编码是最常见的方法。有损压缩能够达到较高的压缩比。对于声音可达4:18:1,对于动态的视频数据更是可高达100:1400:1之多。图10-1总结出了各种常见的数据压缩方法。图10-1常见的数据压缩法版权方授权希赛网发布,侵权必究10.3.3数据压缩标准常用的数据压缩标准如下。1.H.261它主要是针对在ISDN上实现电信会议应用,特别是面对面的可视电话和视频会议而设计的。它的算法类似于MPEG,但实时编码时比MPEG占用CPU小,它在图像质量与运动幅度间进行了折中,即剧烈运动的图像要比相对静止的图像的质量差。它属于恒定码流可变质量编码。它采用CIF(公共中间格式)和QCIF(四分之一CIF)作为可视电话的视频格式。2.H.263它主要是针对低带宽通信而设计的,它在低带宽下能够提供比H.261更好的图像效果。不仅支持CIF和QCIF,还支持SQCIF(八分之一CIF)和4CIF,16CIF.后来又推出了H.263+,增加了在易误码、易上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日音频技术概述丢包、异构网络下的传输效果,现在已基本代替了H.261.3.JPEG这是采用基于DCT(离散余弦变换)和可变长编码的算法。它的关键技术是变换编码、量化、差分编码、哈夫曼编码和行程编码等。JPEG2000作为JPEG标准的一个更新换代标准,它的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、Internet网上服务和保安等方面的应用。它与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散余弦变换为主的区块编码方式,而采用以离散小波转换(WaveletTransform)为主的多解析编码方式。此外,JPEG2000还将彩色静态画面采用的JPEG编码方式与二值图像采用的JBIG编码方式统一起来,成为对应各种图像的通用编码方式。4.MPEGMPEG(动态图像专家组)是ISO制定和发布的视频、音频和数据的压缩标准。它的三大特点是兼容性好;压缩比高,可达200:1;数据的损失很小。MPEG采用预测和插补两种帧间编码技术。MPEG视频压缩算法中包含两种基本技术:一种是基于l6?16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT的压缩,用于减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。常用的MPEG标准如表10-4所示。表10-4MPEG主要标准5.DVI与MPEG-1相当,可达VHS水平,压缩后数据传输速率为1.5Mbps.为了扩大DVI的应用,Intel公司还推出了DVI算法的软件解码算法,可以将未压缩的数字视频文件压缩为原来的1/51/10.版权方授权希赛网发布,侵权必究上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日音频数据存储和传输10.4音频数据10.4.1音频技术概述音频技术用于实现计算机对声音的处理。声音是一种由物体振动而产生的波。当物体振动时,使周围的空气不断地压缩和放松,并向四周扩散,这就是声波。人可以听到的声音频率范围是20Hz20kHz.声音的三个要素是音强、音调和音色。音强是声音的强度,取决于声间的振幅;音调与声音的频率有关,频率高则声音高,频率低则声音低;音色是由混入基音的泛音决定的。每个基音又都有固有的频率和不同音强的泛音,从而使得每个声音都具有特殊的音色效果。音频技术包括音频采集(模拟音转换为计算机识别的数字信号)、语音解码/编码、文字-声音的转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。通常实现计算机语音输出有两种方法,分别是录音/重放和文字-声音转换。(1)录音/重放:可获得高音质声音,并能够保留特定人或乐器的音色,但存储量会随时呈线性增长。(2)文字-声音转换:需预先建立语音参数数据库、发音规则库,然后通过计算机自动合成。虽然语音参数库的大小不会随时长增大,但发音规则库会随着语音质量的要求而增大。语音合成技术可以分为发音参数合成、声音模型参数合成和波形编辑合成三种。合成策略包括频谱逼近和波形逼近。版权方授权希赛网发布,侵权必究10.4.2音频数据存储和传输在计算机中,要存储声音信息就必须对其数字化,通常需要经过采样、量化和编码三个步骤:(1)采样:在模拟音频信号转换为数字音频信号时,每隔一个时间间隔就在模拟声音的波形上取一个幅度值。这个间隔时间称为采样频率。常用的采样频率为8kHz、11.025kHz、16kHz、22.05kHz(FM广播音质)、44.1kHz(CD音质)、48kHz(DVDAudio或专业领域),频率越高音质越好。它的选择是由尼奎斯特理论确定的,即采样频率不应低于声音信号最高频率的两倍。(2)量化:用数字来表示音频幅度时,把某一幅度范围内的电压用一个数字表示,这个量化的级别通常用位(bit)来表示,位数越高音质越好。(3)编码:将声音数据写成计算机的数据格式。在没有压缩之前,每秒钟所需的存储量可由下式估算出:文件的字节数=采样频率(Hz)量化/采样位数(位)声道数8而如果要在网络上传输这样的文件,它需要的数据传输速率则是每秒的位数,也就是在上一个公式的基础上,将单位由Byte转换为bit,即将最后的8去掉。上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日音频数据格式上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日颜色空间版权方授权希赛网发布,侵权必究10.4.3音频数据格式主要的音频数据格式如下:(1)WAVE,扩展名为WAV:该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。(2)MOD,扩展名MOD、ST3、XT、S3M、FAR、669等:该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确,音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐被淘汰,目前只有MOD迷及一些游戏程序中尚在使用。(3)Layer-3,扩展名为MP3:现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。Layer-3是MPEG标准的一部分,是一种强有力的音频编码方案。Layer-3在现存的MPEG-1和MPEG-2国际标准的音频部分上均有定义,简称MP3(MPEGAudioLayerIII)。(4)RealAudio,扩展名RA:这种格式具有强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。(5)CDAudio音乐CD,扩展名CDA:唱片采用的格式,又叫红皮书格式,记录的是波形流,绝对地纯正、HIFI.但缺点是无法编辑,文件长度太大。(6)MIDI,扩展名MID:作为音乐工业的数据通信标准,MIDI能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果。MIDI文件是按照MIDI标准制成的声音文件。MIDI文件记录声音的方法与WAV完全不同,它并不记录对声音的采集数据,而是记录编曲的音符、音长、音量和击键力度等信息,相当于乐谱。由于MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令,因此它占用的存储空间比WAV文件小很多。即使是长达十多分钟的音乐其存储量最多也不过是几十千字节。(7)CreativeMusicalFormat,扩展名CMF:Creative公司的专用音乐格式,和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。版权方授权希赛网发布,侵权必究上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日亮度、色调和饱和度上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日颜色空间10.5颜色空间本节主要介绍颜色的特征、颜色空间、图形和图像等。版权方授权希赛网发布,侵权必究10.5.1亮度、色调和饱和度视觉上的彩色可用亮度、色调和饱和度来描述,任意一种彩色光都是这3个特征的综合效果。亮度是光作用于人眼时所引起的明亮程度的感觉,它与被观察物体的发光强度有关;由于其强度不同,看起来可能亮一些或暗一些。对于同一物体照射的光越强,反射光也越强,感觉越亮,对于不同物体在相同照射情况下,反射性越强者看起来越亮。显然,如果彩色光的强度降至使人看不清了,在亮度等级上它应与黑色对应;同样,如果其强度变得很大,那么亮度等级应与白色对应。此外,亮度感还与人类视觉系统的视敏功能有关,即使强度相同,颜色不同的光进入视觉系统,也可能会产生不同的亮度。色调是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性。如红色、绿色等都是指色调。不透明物体的色调是指该物体在日光照射下,所反射的各光谱成分作用于人眼的综合效果;透明物体的色调则是透过该物体的光谱综合作用的效果。饱和度是指颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度。对于同一色调的彩色光,饱和度越深,颜色越鲜明,或者说越纯。例如:当红色加进白光之后冲淡为粉红色,其基本色调还是红色,但饱和度降低;换句话说,淡色的饱和度比深色要低一些。饱和度还和亮度有关,因为若在饱和的彩色光中增加白光的成分,由于增加了光能,因而变得更亮了,但是它的饱和度却降低了。如果在某色调的彩色光中掺入别的彩色光,会引起色调的变化,掺入白光时仅引起饱和度的变化。版权方授权希赛网发布,侵权必究10.5.2颜色空间三原色原理是色度学中最基本的原理,是指自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)3种颜色按不同比例相配制而成;同样绝大多数颜色光也可以分解成红、绿、蓝三种色光。当然三原色的选择并不是惟一的,也可以选择其他3种颜色为三原色,但是,3种颜色必须是相互独立的,即任何一种颜色都不能由其他两种颜色合成。由于人眼对红、绿、蓝3种色光最敏上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日图形与图像感,因此,由这3种颜色相配制所得的彩色范围也最广,所以一般都选用这3种颜色作为基色。1.RGB颜色空间在多媒体计算机技术中,用得最多的是RGB颜色空间表示。因为计算机的彩色监视器的输入需要R、G、B三个彩色分量,通过3个分量的不同比例,在显示屏幕上可以合成所需要的任意颜色,所以不管多媒体系统采用什么形式的颜色空间表示,最后的输出一定要转换成RGB颜色空间表示。2.YUV颜色空间在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD摄像机,把摄得的彩色图像信号经分色棱镜分成R0、G0、B03个分量的信号;分别经放大和校正得到三基色,再经过矩阵变换电路得到亮度信号Y、色差信号RY和BY,最后发送端将Y、RY和BY3个信号进行编码,用同一信道发送出去,这就是我们常用的YUV颜色空间。数字化位通常采用Y:U:V=8:4:4或者Y:U:V=8:2:2.YUV颜色空间与RGB颜色空间的换算关系如下:Y=0.3*R+0.59*G+0.11*B.U=(BY)*0.493.V=(RY)*0.877.3.CMY颜色空间彩色印刷或彩色打印的纸张是不能发射光线的,因而印刷机或彩色打印机就只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料。油墨或颜料的三基色是青(Cyan)、品红(Magenta)和黄(Yellow),简称为CMY.青色对应蓝绿色,品红对应紫红色。理论上说,任何一种由颜料表现的颜色都可以用这三种基色按不同的比例混合而成,这种颜色表示方法称CMY颜色空间表示法。彩色打印机和彩色印刷系统都采用CMY颜色空间。在彩色喷墨打印机中,将油墨进行混合后得到的颜色称为相减混色,相减混色利用了滤光特性,即在白光中减去不需要的彩色,留下所需要颜色。如印染、颜料等采用的相减混色。相减混色关系式如:黄色=白色-蓝色,青色=白色-红色,红色=白色-蓝色-绿色,黑色=白色-蓝色-绿色-红色。相加混色不仅运用三基色原理,还进一步利用人眼的视觉特性,产生较相减混色更宽的彩色范围。激光打印机、喷墨打印机可用减色合成法打印彩色。4.其他颜色空间表示颜色空间表示还有很多种,如CIE(国际照明委员会)制定的CIEXYZ、CIELAB颜色空间和CCIR(ConsultativeCommitteeInternationalRadio)制定的CCIR601-2YCC颜色空间,以及HSI(Hue,Saturation,Intensity)等。版权方授权希赛网发布,侵权必究10.5.3图形与图像在计算机科学中,图形和图像这两个概念是有区别的。1.图像第10章:多媒体基础作者:希赛教育软考颜色空间图像也称为位图或点阵图,是指由输入设备捕捉的实际场景画面或以数字化形式存储的任意画面。图像都是由一些排成行列的像素组成的,在计算机中的存储格式有BMP、PCX、TIF、GIFD等,一般数据量较大。它除了可以表现真实的照片,也可以表现复杂绘画的某些细节,并具有灵活和富于创造力等特点。通常把一幅位图图像作为一个点矩阵处理,矩阵中的一个元素(像素)对应图像的一个点,相应的值表示该点的灰度或颜色等级。2.图形图形也称矢量图形,一般指用计算机绘制的画面,如直线、圆、圆弧、任意曲线和图表等。图形是用一个指令集合来描述的,这些指令用来描述图中线条的形状、位置、颜色等各种属性和参数。与图像文件不同,在图形文件中只记录生成图的算法和图上的某些特征点。在计算机还原输出时,相邻的特征点之间用特定的很多段小直线连接形成曲线,若曲线是一条封闭的图形,也可用色算法来填充颜色。它的最大优点是容易进行移动、缩放、旋转和扭曲等变换,主要用于表示线框型的图画、工程制图、美术字等。常用的矢量图形文件有3DS、DXF、WMF等。图形只保存算法和特征点,所以相对于位图的大数据量来说,它占用的存储空间也较小。但由于每次屏幕显示时都需重新计算,故显示速度没有图像快。另外在打印输出和放大(缩小)时,图形的质量较高而点阵图常会发生失真。3.分辨率图形(图像)的主要指标有分辨率、点距、色彩数(灰度)。(1)分辨率:可以分为屏幕分辨率和输出分辨率。屏幕分辨率是指每英寸的点阵的行数或列数,这个数值越大,显示质量就越好。输出分辨率是指每英寸的像素点数,是衡量输出设备的精度的,数值越大,质量越好。(2)点距:指两个像素之间的距离,一般来说,分辨率越高,则像素点距的规格越小,显示效果越好。(3)深度:图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。通常,图像深度也指存储每个像素所用的存储器位数,或者说用多少位存储器单元来表示,它也是用来度量图像分辨率的。每个像素颜色或灰度被量化后所占用的存储器位数越多,它能表达的颜色数目就越多,它的深度就越深。例如:一个点有n位色,则说明这个点用2n种颜色表示。图像文件是采用点阵(像素)来描述的,而在存储时也是针对点阵进行描述的。而每个点阵,我们将采用n位来表示其颜色(可以表示2n种颜色)。位数越多,可以表示的色彩也就越丰富。例如:某图像的分辨率为640480,假设每个像素为16位,则该图像的容量(大小)为:这里的每个像素为16位说明每个像素需要用2个字节来表示,每个像素有216=65535种颜色。又如,某256色的图像的分辨率为640480,则该图象的大小为:这里的256色的图像说明每个像素需要用1个字节来表示(28=256)。4.文件格式常见的图形/图像文件有以下几种:(1)BMP(BitMapPicture):PC上最常用的位图格式,有压缩和不压缩两种形式,该格式可表现从2位到24位的色彩,分辨率也可从480320至1024768dpi.该格式在Windows环境下相当稳定,在文件大小没有限制的场合中运用极为广泛。(2)DIB(DeviceIndependentBitmap):描述图像的能力基本与BMP相同,并且能运行于多种硬件平台,只是文件较大。(3)PCP(PCPaintbrush):由Zsoft公司创建的一种经过压缩且节约磁盘空间的PC位图格式,它最高可表现24位图形(图像)。过去有一定市场,但随着JPEG的兴起,其地位已逐渐日落西山了。(4)DIF(DrawingInterchangeFormat):AutoCAD中的图形文件,它以ASCII方式存储图形,表现图形在尺寸大小方面十分精确,可以被CorelDraw,3DS等大型软件调用编辑。(5)WMF(WindowsMetafileFormat):MicrosoftWindows图元文件,具有文件短小、图案造型化的特点。该类图形比较粗糙,并只能在MicrosoftOffice中调用编辑。(6)GIF(GraphicsInterchangeFormat):在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式。缺点是存储色彩最高只能达到256种,由于存在这种限制,除了Web网页还在使用它外,其他场合已很少使用了。(7)JPG(JointPhotographicsExpertGroup):可以大幅度地压缩图形文件的一种图形格式。对于同一幅画面,JPG格式存储的文件是其他类型图形文件的1/10到1/20,而且色彩数最高可达到24位,所以它应用相当广泛。(8)TIF(TaggedImageFileFormat):文件体积庞大,但存储信息量亦巨大,细微层次的信息较多,有利于原稿阶调与色彩的复制。该格式有压缩和非压缩两种形式,最高支持的色彩数可达16兆种。(9)EPS(EncapsulatedPostScript):用PostScript语言描述的ASCII图形文件,在PostScript图形打印机上能打印出高品质的图形(图像),最高能表示32位图形(图像)。该格式分为PhotoshopEPS格式AdobeIllustratorEPS和标准EPS格式,其中后者又可以分为图形格式和图像格式。(10)PSD(PhotoshopStandard):Photoshop中的标准文件格式,专门为Photoshop而优化的格式。(11)CDR(CorelDraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw应用程序均能使用的图形(图像)文件,是发展成熟的CDR文件。(12)IFF(ImageFileFormat):用于大型超级图形处理平台,比如AMIGA机,好莱坞的特技大片多采用该图形格式处理。图形(图像)效果,包括色彩纹理等逼真再现原景。当然,该格式耗用的内存外存等的计算机资源也十分巨大。(13)TGA(TaggedGraphic):是Truevision公司为其显示卡开发的图形文件格式,创建时期较早,最高色彩数可达32位。VDA,PIX,WIN,BPX,ICB等均属其旁系。(14)PCD(PhotoCD):由KODAK公司开发,其他软件系统对其只能读取。(15)MPT(MacintoshPaintbrush)或MAC:Macintosh机所使用的灰度图形(图像)模式,在MacintoshPaintbrush中使用,其分辨率只能是720567dpi.(16)SWF(Flash):Flash是Adobe公司制定的一种应用于Internet的动画格式,它是以矢量图作为基本的图像存储形式的。除此之外,Macintosh机专用的图形(图像)格式还有PNT、PICT、PICT2等等。上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日视频数据上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日视频文件格式版权方授权希赛网发布,侵权必究10.6视频数据动态图像,包括动画和视频信息,是连续渐变的静态图像或图形序列沿时间轴顺次更换显示,从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,常称为动画;当序列中每帧图像是通过实时摄取自然的景像或活动的对象时,常称为影像视频,或简称视频。版权方授权希赛网发布,侵权必究10.6.1视频文件格式视频信息在计算机中存放具体格式有很多,常见的有下列几种。(1)Quicktime:Quicktime是苹果的公司的产品,采用了面向最终用户桌面系统的低成本、全运动视频的方式,在软件压缩和解压缩中也开始采用这种方式。向量量化是Quicktime的软件压缩技术之一,它在最高为30帧/秒下提供的视频分辨率是320240,而且不用硬件帮助。向量量化预计可成为全运动视频的主要技术,向量量化方法达到的压缩比例为25:1200:1.其视频信息采用MOV或QT文件格式。(2)AVI:AVI是微软公司的视频格式。音频视频交错(AVI)也是桌面系统上的低成本低分辨率的视频格式,AVI可在160120的视窗中以15帧/秒回收视频并可带有8位的声音。也可以在VGA或超级VGA监视器上回收。与超过320线的VCR分辨率相比,这一分辨率明显低于正常电视信号的分辨率。AVI很重要的一个特点是可伸缩性,使用AVI算法的性能依赖于它一起使用的基础硬件。AVI包括了几种基于软件的压缩和解压缩算法,其中某些算法被优化用于运动视频,其他算法则被优化用于静止视频。(3)RealMedia:RealMedia是RealNetworks公司所制定的音频/视频压缩规范,采用了流的方式播放,使用户可以边下载边播放,而且其极高的影像压缩率虽然牺牲了一些画质与音质,但却能在较慢的网速上流畅地播放RealMedia格式的音乐和视频。RealMedia是目前Internet上最流行的跨平台的客户/服务器结构多媒体应用标准,其采用音频/视频流和同步回放技术实现了网上全带宽的多媒体回放。在RealMedia规范中主要包括三类文件:RealAudio(用以传输接近CD音质的音频数据)、RealVideo(用来传输连续视频数据)和RealFlash(RealNetworks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。其文件格式通常为RA或RM,一张用RM格式压缩的光盘上可以存放4部电影。RealPlayer是Realmedia的播放工具,利用Internet资源对这些符合RealMedia上一节本书简介下一节第10章:多媒体基础作者:希赛教育软考学院来源:希赛网2014年05月21日流媒体技术规范的音频/视频进行实况转播。(4)ASF:ASF是AdvancedStreamingFormat(高级流格式)的缩写,是微软公司为了和RealMedia竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。由于它使用了MPEG-4的压缩算法,所以压缩率和图像的质量都很不错。因为ASF是以一个可以在网上即时观赏的视频流格式存在的,所以它的图像质量比VCD差,但比同是视频流格式的RealMedia格式要好。(5)WMV:WMV是一种独立于编码方式的在Internet上实时传播多媒体的技术标准,微软公司希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名。WMV的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。版权方授权希赛网发布,侵权必究10.6.2流媒体流(Streaming)是近年在Internet上出现的新概念,其定义非常广泛,主要指通过网络传输多媒体数据的技术总称。流媒体包含广义和狭义两种内涵:广义上的流媒体指的是使音频和视频形成稳定和连续的传输流和回放流的一系列技术、方法和协议的总称,即流媒体技术;狭义上的流媒体是相对于传统的下载-回放方式而言的,指的是一种从Internet上获取音频和视频等多媒体数据的新方法,它能够支持多媒体数据流的实时传输和实时播放。通过运用流媒体技术,服务器能够向客户机发送稳定和连续的多媒体数据流,客户机在接收数据的同时以一个稳定的速率回放,而不用等数据全部下载完之后再进行回放。目前实现流媒体传输主要有两种方法:顺序流传输(progressivestreaming)和实时流传输(real-timestreaming),它们分别适合不同的应用场合。(1)顺序流传输。顺序流传输采用顺序下载的方式进行传输,在下载的同时用户可以在线回放多媒体数据,但给定时刻只能观看已经下载的部分,不能跳到尚未下载的部分,也不能在传输期间根据网络状况对下载速度进行调整。由于标准的HTTP服务器就可以发送这种形式的流媒体,而不需要其他特殊协议的支持,因此也常常被称作HTTP流式传输。顺序流式传输比较适合高质量的多媒体片段,如片头、片尾或者广告等。(2)实时流传输。实时流式传输保证媒体信号带宽能够与