《多媒体技术基础.pptx》由会员分享,可在线阅读,更多相关《多媒体技术基础.pptx(81页珍藏版)》请在第壹文秘上搜索。
1、91 多媒体技术基础多媒体技术基础一、多媒体技术概论一、多媒体技术概论 二、音频技术二、音频技术三、视频技术三、视频技术 四、数字图像技术四、数字图像技术 五、数据压缩技术五、数据压缩技术 六、光存储技术及其标准化六、光存储技术及其标准化 一、多媒体技术概论一、多媒体技术概论1、多媒体计算机技术n计算机的发明不仅使信息处理变得更精确、灵活,更重要的是拓展了人类处理复杂信息的能力和手段;n多媒体技术的出现使信息的载体更加丰富,它标志着第四次信息革命的开始,它也将给人类带来极其深刻的影响。n多媒体计算机技术是指用计算机综合处理和控制多媒体信息文字、声音、图形、图象、动画和活动影像等,使多种信息建立
2、逻辑连接,集成为一个系统并具有交互性。2. 智能计算机的研制工作推动了计算机多媒体技术的诞生和发展研究人员开始认识到人机界面问题研究人员开始认识到人机界面问题的重要性:的重要性:良好的人机界面良好的人机界面能充分发能充分发挥人类理解能力、想象能力以及计算挥人类理解能力、想象能力以及计算机巨大存储和分析计算能力的优势。机巨大存储和分析计算能力的优势。多媒体计算机技术可以认为是这种努多媒体计算机技术可以认为是这种努力的继续和发展,它最终将实现人与力的继续和发展,它最终将实现人与计算机的计算机的自然交流自然交流。3.*多媒体技术的主要内容 (1)多媒体数据压缩技术多媒体数据压缩技术(2)多媒体存储技
3、术多媒体存储技术(3)多媒体专用芯片技术多媒体专用芯片技术(4)多媒体输入多媒体输入/输出技术输出技术(5)多媒体系统软件技术多媒体系统软件技术多媒体操作系统、多媒体编辑系统、多多媒体操作系统、多媒体编辑系统、多媒体数据库管理技术、多媒体信息的媒体数据库管理技术、多媒体信息的混合与重叠技术等。混合与重叠技术等。二、音频技术 音频技术主要包括音频数字化、语音处理、合成及识别等技术。1.1.音频数字化技术音频数字化技术 音频数字化就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理的过程,主要包括采样和量化两个方面。 下图为声音模拟信号数字化过程示意图。声音的模拟信息采样量化
4、编辑声音的数字信息(1)采样 对信号的时间采样指的是在有规律的时间间隔T内,对模拟信号进行检测和测量。由此,某个连续信号S(t)的采样样本可表示为: S(t)=S(T), S(2T), S(3T), S(nT) 其中,T为采样周期,而采样频率可以表示成f=1/T,采样频率是对声音波形每秒钟进行采样的次数。 n用数字方式记录声音,首先需对声波采样。tS(t)T 3T 5TnNyquist(奈奎斯特)的采样定理:若输入信号包含的最高频率为fn, 则以不低于2fn,采样频率对原输入信号进行采样所得的采样信号所得的采样值可以无失真地重构原输入信号。n入耳听觉的频率上限在20kHz左右,根据采样理论,为
5、了保证声音不失真,采样频率应在40kHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.1kHz等。采样频率越高,声音失真越小、音频数据量越大。 (2)量化与编码 在完成了对模拟信号的采样后,再对采样值进行量化并编码成二进制位。n量化:量化过程就是把采样值表示成一个离散振幅值的集合。n编码:用二进制数表示每个取样点的数值大小。n量化位数:表示每个取样点二进制数位数。量化位数决定了被记录和重放的声音最高与最低之间的差值。例如: 3位量化位数,则由000变化到111,仅有8个不同的值; 8位量化位数每个采样点可以表示256个(0-255)不同量化值; 16位量化位数则可以表示
6、为216,即65536个不同的量化值。量化位数越高音质越好,数据量也越大。(3)声道数n描述一:记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。n描述二:声道数是指所使用的声音通道的个数,它表明声音记录只产生一个波形(即单音或单声道)还是两个波形(即立体声或双声道)。 当然,立体声听起来要比单声音丰满优美,但需要两倍于单音的存储空间。n声音数字化后每秒所需的存储量(假定不经压缩)估算公式: 存储量(byte)(采样频率量化位数)8 若采用双声道录音,存储量再增加一倍。2. 数字音频数据的获取途径n购买数字式音乐/音像作品
7、n自己录制n委托专业部门利用专门设备进行录制n制作乐器数字接口(MIDI)文件3.语音的编辑处理n通过编辑可以实现各种声音混合以及消除或降低声音中的畸变等。n一般的音频编辑软件(如WaveEdit等)都具有设置音量、渐强渐弱处理及多通道的混合等常用功能。n编辑处理WAV(音频波形)文件的软件分为单轨和多轨两种。Windows自带的“ 录音机”是一个单轨编辑软件,只能作简单的声音处理。专业的编辑软件有Cool Edit、Sound Forge、Vegas Audio等。利用Premiere非线性编辑软件也可以进行WAV声音文件的编辑处理。4.乐器数字接口(MIDI) 协议 (1) “ MIDI”
8、指的是什么指的是什么?nMIDIMusical Instrument Digital InterfacenMIDI是为了把电子乐器与计算机相连而制定的一个规范,是数字音乐的国际标准。nMIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。MIDI标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。 (2)MIDI文件及其播放文件及其播放nMIDI声音与数字化波形声音完全不同,它不是对声波进行采样、量化和编码,而是将电子乐器键盘的弹奏信息记录下来,包括键名、力度、时值长短等,这些信息称之为MIDI消息,是乐谱的一种数字式描述。n当需要
9、播放时,只需要从相应的MIDI文件中读出MIDI消息,生成所需要的乐器声音波形,经放大后由扬声器输出。(3)MIDI文件的生产文件的生产nMIDI文件可以通过作曲软件或电子琴制作。作曲软件电子琴键盘MIDI文件管理MIDI编辑/播放软件声音合成器立体声功放MIDI消息MIDI消息MIDI文件多媒体计算机中多媒体计算机中MIDI声音的处理过程声音的处理过程三、视频技术 1.模拟视频与数字视频模拟视频与数字视频模拟视频模拟视频:模拟视频是基于模拟技术以及图像的广播与显示所确定的国际标准。n优点:模拟视频图像具有成本低和还原度好。n缺点:不论被记录的图像多么清晰,经过长时间的存放之后,视频质量将大为
10、降低;或者经过多次复制之后,图像的失真就会很明显。 数字视频:数字视频:而数字视频可以弥补这些缺陷。它不仅可以无失真地进行无限次复制,而且还可以对视频进行创造性的编辑,如特技效果等。2. 数字视频技术的涵义数字视频技术的涵义 数字视频技术有两层涵义:n 一是将模拟视频信号输入计算机进行数字化视频编辑,最后制成数字视频产品;n二是指视频图像由数字摄像机拍摄下来,从信号源开始,就是无失真的数字视频,当输入计算机时不再考虑视频质量的衰减问题。这种才是更为纯粹的数字视频技术。 现在的数字视频技术主要还是第一层涵义,即模拟视频的数字化处理、存储和输出技术。 3. 视频制式标准视频制式标准n现在,国际上流
11、行的视频制式标准主要有:NTSC制式、PAL制式和SECAM制式。n这些制式标准定义了彩色电视机对视频信号的解码方式,不同制式对色彩处理方式、屏幕扫描频率等有不同的规定。因此,如果计算机系统处理视频信号的制式应与其相连的视频设备的制式相同。 (1)NTSC制式制式nNTSCNational Television Standard Committee)n美国、日本、台湾等地区使用NTSCnNTSC制式规定,每秒30帧视频画面,水平扫描线为525条(垂直分辨率),水平分辨率为240400个像素点,采用隔行扫描方式,场频(又称垂直扫描频率)为60Hz。 (2)PAL制式制式 PALPhase Alt
12、ernate Line(相位交替扫描线) 中国及欧洲大多数地区使用PAL制式 PAL制式规定:每秒25帧,每帧625行,每行240400个像素点,隔行扫描方式,场频为50Hz。(3) SECAM制式制式nSECAM-Sequential Color and Memory System(顺序传送彩色和存储电视)n适用于法国、苏联、非洲地区nSECAM规定:水平扫描线为625条,水平分辨率为625个像素点,场频为50Hz4. 视频技术n视频技术包括视频信号数字化和视频编码两个方面。(1) 视频信号数字化视频信号数字化n通常,NTSC制式、PAL制式和SECAM制式的视频信号都是模拟的,在进入计算机
13、前必须进行数字化处理。n与音频数字化一样,视频数字化的目的是将模拟视频信号经模数转换和彩色空间变换等过程,转换成数字计算机可以显示和处理的数字信号。n视频的数字化是指在一段时间内以一定的速度对视频信号进行捕获并加以采样后形成数字化数据的处理过程。(2)视频编码n视频编码是将数字化视频信号经过编码成为电视信号,从而可以录制到录像带上或在电视上播放。 四、数字图像技术 图形与图像:计算机科学中的图形和图像概念是有区别的:n图形(Graphics)图形一般指用计算机绘制(draw)的画面,如直线、圆、圆弧、矩形、任意曲线和图表等;n图像(image或Picture等)图像则指由输入设备捕捉实际场景画
14、面产生的数字图像数字图像。数字图像:n数字图像指由数字摄像机、数字相机或扫描仪等设备输入并存储在计算机中的数字信息。n数字图像通常有位图和矢量图形两种表示形式。1. 矢量图形 (1) 什么是矢量图形?什么是矢量图形? 矢量图形是用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、圆弧、矩形、曲线等图元的位置、维数和形状。在屏幕上显示矢量图形要有专门软件将描述图形的指令转换成在屏幕上显示的形状和颜色。(2) 矢量图形的特点矢量图形的特点n矢量图形的一个很大的优点就是容易进行移动、缩放、旋转和扭曲等变换;n用矢量图形格式表示复杂图像(如人物或风景照片)的开销太大,因此矢量图形
15、主要用于表示线框型的图画、工程制图、美术字等。n绝大多数CAD和3D造型软件使用矢量图形作为基本的图形存储格式。2. 位图图像(1)什么是什么是位图位图?n位图图像由数字阵列信息组成,用以描述图像中各像素点的强度与颜色。 (2)位图图像特点位图图像特点n 位图适合于表现含有大量细节(如明暗变化、场景复杂和多种颜色等)的画面,并可直接、快速地在屏幕上显示出来。n 位图占用存储空间较大,一般需要进行数据压缩。n 位图文件格式:为了便于位图的存储和交流,产生了种类繁多的文件格式,常见有PCX、BMP、DIB、PIC、GIF、TGA和TIFF等。3分辨率与图像深度 (1) 分辨率分辨率 分辨率有屏幕分
16、辨率、图像分辨率 。n屏幕分辨率:屏幕分辨率是指屏幕上水平与垂直方向的像素最大个数。 例如:640480, 800 600, 1024 768n图像分辨率:图像分辨率指数字图像在水平与垂直方向的像素个数。n图像分辨率与屏幕分辨率不同: 例如,若图像分辨率为320240,屏幕分辨率为640480,则该图像在屏幕上显示时只占据屏幕四分之一。图像分辨率与屏幕分辨率相同时,显示的图像正好占满整个屏幕区域;图像分辨率大于屏幕分辨率时,屏幕上只能显示出图像的一部分。 (2) 图像深度图像深度图像深度图像深度:表示位图中一个像素的颜色信息所用的二进制数据位数,称为图像深度。 深度为1的图像只能有两种颜色(通常为黑色和白色),通常称为单色图像; 深度为4的图像可以有16种颜色; 深度为8的图像可表示256种颜色。 位图图像所需的存储空间可用下面的公式计算: 文件的字节数=(位图高度位图宽度位图深度)/8五、数据压缩技术 数据压缩就是减少用于存储和传输信息的位数。(1)数据压缩的必要性(2)数据压缩的可能性(3)数据压缩方法简介(4)三种流行的数据压缩国际标准 1. 数据压缩的必要性(1) 各种媒体信息