《多媒体数据压缩技术.pptx》由会员分享,可在线阅读,更多相关《多媒体数据压缩技术.pptx(99页珍藏版)》请在第壹文秘上搜索。
1、2023-4-24多媒体数据压缩技术多媒体数据压缩技术第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n3.1 概述n3.2 数据压缩的基本方法n3.3 静态图像压缩编码国际标准JPEGn3.4 运动图像压缩编码国际标准MPEGn3.5 音频数字化与压缩编码技术第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n多媒体数据压缩编码的重要性u数据冗余类型u数据压缩技术的分类第第3章章 多媒体数据多媒体数据压缩编码技术压缩编码技术n媒体数据压缩编码的重要性u 信息时代的重要特征是信息的数字化。u 早期的计算机系统采用模拟方式表示信息,但存在着明显的缺点:u 经常会产生噪音和信号丢失,
2、并且在复制过程中逐步积累噪音和误差。u 模拟信号不适合数字计算机加工处理。媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的 1. 图像数据量的大小可用下面的公式来计算: 图像数据量图像的总像素色彩深度8 ( 单 位 为 B y t e , 简 写 为 B ) 例如,一幅640480、24位(bit)真彩色 的 图 像 , 其 文 件 大 小 为 :64048024 8 921.6KB媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 2. 双通道立体声激光唱盘,采用脉冲码调制采样,采样频率为44.1KHz,采样精度16位,其一秒钟时间
3、内的采样数据量为: 44.110001628176.4 KB 一个650MB的CDROM,大约可存1小时的音乐。媒体数据压缩媒体数据压缩编码的重要性编码的重要性n 3. 对动态图形和视频图像。例如对于彩色电视信号,设代表光强Y的带宽为4.2MHz、色彩I为1.5MHz和色饱和度Q为0.5MHz,采样频率2倍原始信号频率,各分量均被数字量化为8位,从而1秒钟电视信号的数据量为: (4.21.50.5)281000000812.4 MB媒体数据压缩媒体数据压缩编码的重要性编码的重要性u 容量为650MB的CDROM仅能存1分钟的原始电视数据。若为高清晰度电视(HDTV)其1秒钟数据量约为150MB
4、(1.2Gbps8),一张CDROM还存不下5秒钟的HDTV图像。n 巨大数字化信息的数据量对计算机存储资源和网络带宽有很高的要求,解决的办法就是要对视、音频的数据进行大量的压缩。播放时,传输少量被压缩的数据,接收后再对数据进行解压缩并复原。数据冗余类型数据冗余类型u 1. 空间冗余u 基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间相关性,这些相关性的光成像结构在数字化图像中就表现为空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间相关性,达到减少数据量的目的。数据冗余类型数据冗余类型u 2. 时间冗余u 时间冗余反映在图像序列中的相邻帧图像(电视图像、动画
5、)之间有较大的相关性,一组连续画面中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,把一帧图像中的某物体或场景可以由其他帧图像中的物体或场景进行处理后重构出来,可以大大减少时间冗余。数据冗余类型数据冗余类型u 3. 结构冗余u 有些图像具有较强的相似性的纹理结构,例如布纹图像和草席图像,方格状的地板图案等,我们称此为结构冗余。u 4. 知识冗余u 有许多图像的理解与某些基础知识有相当大的相关性,这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。根据已有的知识,我们可以构造图像物体的基本模型,并创建图像库。数据冗余类型数据冗余类型u 5. 视觉冗余
6、u 人的接收系统如视觉系统和听觉系统是有一定限度的,人眼并不能察觉图像场的所有变化,如人类视觉系统分辨能力约为64灰度等级,而一般图像量化采用256灰度等级,这类冗余我们称为视觉冗余。u 6. 听觉冗余u 人耳的敏感性不能察觉所有频率的变化,存在听觉冗余。数据压缩技术数据压缩技术 的分类的分类n 根据多媒体数据冗余类型的不同,解码后数据与原始数据是否完全一致、质量有无损失来进行分类,压缩方法可被分为有失真编码和无失真编码两大类。u 无失真压缩法也称无损压缩,无失真压缩的特点是压缩比较小,大约在2l至5l之间,主要用于文本数据、程序代码和某些要求严格不丢失信息的环境中,常用的无失真压缩编码有如哈
7、夫曼编码等。数据压缩技术数据压缩技术 的分类的分类u 有失真压缩法也称有损压缩,有失真压缩法的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等,压缩比可以从几到几百倍,常用的有失真压缩编码技术有预测编码、变换编码、模型编码、混合编码方法等。主要用于压缩图像、声音等信息。n 常用的图像和视频压缩方法如图3-1所示:图像和视频压缩方法图像和视频压缩方法哈夫曼编码哈夫曼编码行程编码行程编码算术编码算术编码LZW编码编码DCT编码编码小波变换小波变换子带编码子带编码无失真压缩无失真压缩有失真压缩有失真压缩预测编码预测编码变换编码变换编码模型编码模型编码运动补偿运动补偿混合编码混合编码分形编
8、码分形编码JPEGMPEGH. 261数据压缩技术数据压缩技术 的分类的分类行程(游程)行程(游程)RLE 编码技术编码技术n 行程编码主要思路是用编码器不断比较信息源符号相邻元素值的变化幅度,一旦发现有明显的变化,就开始一个行程。编码器检测每一个行程起点位置开始的多次重复的比特或者字符序列,然后将一个相同值的连续串出现次数作为行程长度,并将行程长度转换成代码,再取用信息源符号的一个代表值作为代码,这种编码称为行程编码,或称游程编码,常用RLE表示。对一幅两维图像对一幅两维图像F F(i i,j j)作水平)作水平扫描后得到的部分像素的像素值扫描后得到的部分像素的像素值行程(游程)行程(游程)
9、RLE 编码技术编码技术n 用RLE对这一行数据编码后得到的码字表:n RLE编码压缩编码技术尤其适用于: 计算机生成的图形图像和黑白二值图像的编码,解压缩速度很快。RLE的压缩率的大小取决于图像本身的特点,可以得到较大的压缩比。对复杂的图像不适宜用RLE进行编码。编编码码位位 1 2 3 4 5 6 7 8 9 10 11 12 13 14码码字字 8 6 4 8 4 7 8 7 4 6 4 5 5 5编编码码位位 15 16 17 18 19 20 21 22 23 24 25 26码码字字 3 3 8 3 3 3 5 2 4 1 4 0哈夫曼编码技术哈夫曼编码技术n 假设一个信息源能产生
10、的事件序列中的事件取自一个有限事件集,事件集S中的任一事件Si发生的概率为P(Si)都相等,即P(Si) 1/S,则 其 所 能 携 带 的 信 息 量 I ( S i ) 定 义 为: I(Si)log2 1/S log2 P(Si) (33) 这里P(Si)是信息源产生的事件为Si的概率。等式右边加一负号的目的是保证I(Si)的数值不为负值。定义中用2为底的对数,并规定信息量I(Si)的计量单位为比特(bit)。哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码属于一种变字长码,把信息源事件按概率大小顺序排列,对出现概率大的信息源事件赋予短码字,而对于概率小的信息源事件赋予长码,只要码字长度按照信
11、息出现的概率大小逆顺序排列,可通过数学证明这一结论:平均码字长度一定小于其它任何事件顺序的排列方式。哈夫曼编码技术哈夫曼编码技术n 哈夫曼编码一般过程如下:u 1. 把事件(消息)按出现的概率由大到小排成一个序列。如P(1)P(2)P(3)P(Sm-1)P(Sm) ,即将信息源事件按概率递减顺序排列。u 2. 把其中两个最小的概率P(Sm-1) ,P(Sm)挑出来,且将事件“1”赋给其中最小的,即P(Sm)1;事件“0”赋给另一稍大的即P(Sm-1) 0。哈夫曼编码技术哈夫曼编码技术u 3. 把两个最小概率相加作为新事件的概率,即 求 出 P ( S m - 1 ) , P ( S m ) 之
12、 和 P ( S i ) : P ( S i ) = P ( S m - 1 ) 十 P ( S m )设P(Si)是对应于一个新的消息的概率。u 4. 将P(Si)与上面未处理的(m2)个消息P(Sm-2)的概率重新由大到小再排列,构成一个新的概率序列。u 5. 重复步骤2),3),4),在每次合并信息源时,将被合并的信源分别赋“0”和“1”直到所有m个事件的概率均已全部合并处理为止。哈夫曼编码技术哈夫曼编码技术u 6. 寻找从每一个信息源事件到概率总和为1处的路径,对每一信息源事件写出“1”、“0”序列( 从 树 根 到 信 息 源 事 件 节 点 ) 作 为 码 字 。Huffman编码
13、的平均码字长度可以用下列公式求出: 这里的ni ,为第i个消息事件的码字长度,P(Si)为第i个消息出现的概率。举一例子来说明这一编码过程。miiiSPnL1)(消消 息息ABCDEFGH概概 率率0.10.180.40.050.060.10.070.04哈夫曼编码技术哈夫曼编码技术图3-5 哈夫曼编码全过程:F哈夫曼编码技术哈夫曼编码技术n 根据哈夫曼的编码规则,我们得到如表3-2所示: 由于8个消息事件A,B,C,H的每个概率为已知,则哈夫曼码的平均长度L可按公式(3-6) 计算为:L10.4十3(0.180.10)4(0.10十0.06十0 . 0 7 ) 十 5 ( 0 . 0 5 十
14、 0 . 0 4 ) 2 . 6 1 比 特哈夫曼编码技术哈夫曼编码技术n 图像的熵H(S)可按公式(3-5) 计算为: 定义编码效率为熵值H(S)与平均码长L的比值,即: 编码效率 (3-7) = 2 . 5 5 / 2 . 6 1 = 2 . 5 5 / 2 . 6 1 9 7 . 8 % 9 7 . 8 % 哈 夫 曼 编 码 有 它 的 不 足 之 处 : 必须先得到信息源码元(消息)的统计概率,才能进行编码。折中的方法是根据经验值人为地给出Huffman码表,但这样的编码无法达到最佳。比特55. 2)(log)()(12niiiSPSPSHLSH)(LZW编码编码nLZWLZW编码是
15、由编码是由LempleLemple和和ZivZiv提出并经提出并经WelchWelch扩充扩充而形成的无损压缩专利技术。而形成的无损压缩专利技术。n它采用了一种先进的串表压缩,将每个第一次它采用了一种先进的串表压缩,将每个第一次出现的串放在一个串表中,用一个数字来表示出现的串放在一个串表中,用一个数字来表示串,压缩文件只存贮数字,则不存贮串,从而串,压缩文件只存贮数字,则不存贮串,从而使图象文件的压缩效率得到较大的提高。奇妙使图象文件的压缩效率得到较大的提高。奇妙的是,不管是在压缩还是在解压缩的过程中都的是,不管是在压缩还是在解压缩的过程中都能正确的建立这个串表,压缩或解压缩完成后,能正确的建
16、立这个串表,压缩或解压缩完成后,这个串表又被丢弃。这个串表又被丢弃。LZW编码示例编码示例n例如:现有来源于二色系统的图像数据源(假例如:现有来源于二色系统的图像数据源(假设数据以字符串表示):设数据以字符串表示):aabbbaabbaabbbaabb,试对其,试对其进行进行LZWLZW编码及解码编码及解码。 n根据图像中使用的颜色数初始化一个字符串表,根据图像中使用的颜色数初始化一个字符串表,字符串表中的每个颜色对应一个索引。在初始字符串表中的每个颜色对应一个索引。在初始字符串表的字符串表的LZW_CLEARLZW_CLEAR和和LZW_EOILZW_EOI分别为字符表分别为字符表初始化标志和编码结束标志。初始化标志和编码结束标志。n设置字符串变量设置字符串变量S1S1、 S2 S2并初始化为空。并初始化为空。 最后的编码结果为 :30016463LZW编码编码nLZWLZW算法的适用范围算法的适用范围是是原始数据串最好是原始数据串最好是有大量的子串多次重复出现,重复的越有大量的子串多次重复出现,重复的越多,压缩效果越好。反之则越差,可能多,压缩效果越好。反之则越差,可能真的不减反增