小波变换在Internet网多媒体业务中的应用研究

时间：2011-06-19

　　近十几年来数据、语音和多媒体业务的需求在不断增加，同时人们对这些业务的服务质量的期望也越来越高。为了有效防止信号在传输和存储过程引入噪声和导致波形畸变，获得更好的品质，模拟信号（如话音、音频、图像和视频信号）一般都先进行采样和数字化，然后再进行存储、传输和接受重建&但这些数字化信号的数据量极大，尽管海量存储技术、处理器的速度以及数字通信系统的性能的迅猛发展，但对数据存储的能力和数据传输带宽的需求仍然超出了现有技术的能力所及。为了使通信成为可能并尽可能地降低通信费用，信号的压缩是必需的。近几年在已经或将要出现的如视频会议、可视电话、高清晰度电视、交互式电视和远程医疗等诸多商业应用的推动下，图像和视频压缩编码受到了极大的重视。随着Internet网、电信网、广播电视网的逐步融合，图和视频压缩编码也成为图像通信的中心问题之一。本文介绍小波变换在图像压缩、实时连续媒体流等领域的应用。

　　1 小波变换在图像压缩中的应用

　　小波变换以其特有的变换特性在图像压缩领域得到了广泛的应用。如JPEG-2000、MPEG-4静态图像压缩都采用了小波变换的方式。

　　1.1 小波算法的硬件实现

　　美国AD公司的ADV611数字视频编解码芯片是一款低价、单片、多功能、全数字的CMOS超大规模集成电路，片内集成了视频接口、主机接口和SRAM,可以广泛应用于各个相关领域。

　　1.1.1 内部框图

　　图1是ADV611的内部框图，大致可以分为六个模块，其中较有特色的部分是清晰窗口和量化控制两部分。清晰窗口（Quality Box）是将用户感兴趣的部分图像采用压缩比较小的方式编码，而对其余背景区域则加大压缩比。这种方式可以认为是小波编码在空间可伸缩性的一种应用。量化控制是为了满足不同的网络带宽，不同的服务质量而设定的改变编码码率的参量。通过设置不同比特每象素值（Bit Per Pixel）而改变编码码流的数据量，满足不同的网络带宽。图2是采用与ADV611相同压缩算法的软件模拟结构。表1是算法效果统计。

　　其中图2（a）是原始图像（720×486×24位1025K），（b1）、（b2）、（b3）是比特每象素值分别为1、0.5、0.1时的恢复图像。从数据中可以看出随着比特每象素值的降低，压缩后数据量随之降低，而恢复图像与原图的PSNR降低并不多。

　　1.1.2 算法分析

　　ADV611内部的小波变换采用双正交9-7小波基。经过大量的实验证明双交9-7小波基在图像处理中是一种较好的小波基，目前多个国际标准中有关小波压缩的算法，一般都采用这种小波基。ADV611芯片中的小波算法生成的Mallat框图如图3所示。

　　在量化阶段ADV611采用可程控的量化方式。在量化顺序上采用先低频后高频的顺序，如对图3量化的顺序为H、F、G、E、C、D、B、A.在量化系数的选取上充分考虑人类视觉特性给定了每个Mallat块的参考量化系数如图4.图5显示的编/解码端相应的量化方法，图中的BW是Mallat块的参考量化系数。

　　对量化后的数据ADV611采用游程编码与霍夫曼编码相结合的方式进行熵编码，以达到高压缩比的目的。一般来说游程编码和霍夫曼编码属于无损压缩，压缩比都不高，但在小波变换及系数量化后会出现大量的连零系数，这时采用游程编码与霍夫曼编码相结合的方式能达到很高的压缩比.

　　2 小波变换在媒体流压缩中的应用

　　2.1 基于小波变换系数的帧间算法

　　静态图像小波压缩是通过减少图像本身的空间冗余性，达到压缩效果的编码方法，属于帧内压缩。在处理连续媒体流时应注意到帧间相似性是很大的，即帧与帧之间有着很大的时间冗余性，减少这种冗余可以达到更高压缩比，使码流适合于更低比特的信道传输。在综合考虑ADV611硬件实现的基础上，提出一种对小波变换后系数估计补偿的算法。具体的原理图如图6所示。其中小波变换与熵编码是由ADV611硬件实现的。编码后的数据延时一帧后进行存储器，与后一帧系数数据相减，求残差数据，并对残差数据重编码，包括二次量化、霍夫曼编码等。解码端反操作即可。

　　实现这种算法要求具有两个先题条件：（1）小波变换的稳定性。对同一帧图像两次小波变换后生成的码流是相同的，那么当其中一帧图像发生轻微变化时，编码生成后的码流也只是发生少量变化，从而残差数据将会有大量的连零数据出现；（2）编码后码流数据量较小，考虑到硬件实现时要求有存储器存储前一帧变换后的系数，如果码流数据量太大将不适合硬件的实现（此处应该注意的是连续两帧之间熵编码后数据量不一定相同，对缺少的数据补零处理）。利用news序列的前8帧做测试序列，得到的帧间相关性结果如表2所示。

　　以上实验数据表明小波变换后系数存在着极大的帧间相关性。熵编码后相关性降低，但仍然较高，可以充分应用这种相关性。进行帧间压缩。在硬件实现方案中，由于采用ADV611芯片，接口的输出码流是经过熵编码后的数据，帧间压缩的效果没有如图6中虚线所示流程的压缩效果好，但仍然可以一步提高视频序列的压缩比。

　　2.2 基于小波变换的码率控制

　　当前连续媒体流业务中越来越多地考虑对客户的服务质量问题，QoS的提出要求对编码码率的控制更加灵活，以适应不同的用户要求和不同的信道状况。利用ADV611中可程控的量化方式就可以方便地达到码率控制的目的。其原理框图如图7所。B/P是比特每象素的设置，通过软件监控网络状态,并按照一定的经验规律实时更改压缩过程中的B/P设置，以完成对码率的控制。

　　3 实现方案

　　开发小组在充分地进行理论研究及实现方案论证的基础上，应用小波压缩算法，、按照MPEG-4标准的思路提出了一套音视频采集压缩传输的解决方案。硬件实现系统框图如图8所示。

　　主要分为六个模块：（1）音视频捕捉模块，包括音视频的获取及量化；（2）压缩/解压缩模块，该模块是本方案中重要的模块，实现音视频的编剧/解码及同步；（3）接入模块，该模块完成数据的传输，为了进一步减轻主机的负担，采用硬件打包发送的方式；（4）软件控制模块，该模块实时监控网络状态，及时将分析后的网络状态结果通知硬件板卡；（5）控制单元模块，该模块是系统的处理、时序等管理控制中心，还根据软件模块得到的网络状态参数及时地控制编码过程完成码率控制过程；（6）总线接口模块，采用PCI总线方式与主机交换数据。

　　在上述系统压缩/解压缩模块中，采用ADV611压缩芯片，并结合2.1中提出的小波变换系数的帧间算法，简略地实现视频序列的帧间压缩；同时按照控制单元的速率控制参数完成码率控制的过程。

上一篇：数字音频放大：便携式设备音频放大的新手段

下一篇：数字语音混沌保密通信系统设计