一些音频编码解码器芯片主要由围绕一些处理硬件的一个模数转换器(ADC)和一个数模转换器(DAC)组成,但它们只是众所周知的海底冰山露出来的一角。一般来说,音频解码器分为两类,一类是用于Hi-Fi听音的纯音频解码器,即指把CD机等数字音源器材一分为二后,去掉转盘(驱动光碟旋转读盘)的部分。近一段时间,大部分工程师认为音频编解码器就是在DSP平台上运行的压缩和解压缩算法。在整个音频频率范围里,“语音”编解码器适合数字电话应用,而“音频”编解码器则适合娱乐音频应用。
在这个意义上,音频编解码器是从Dolby公司的噪音抑制技术演变成Dolby和其它一些公司更综合性的压缩方法。它们的出现还与国际标准组织(ISO)的运动图像小组(MPEG)有关,该工作小组负责为数字音频和视频的编码表示制定相应的标准。
纯音频解码器的主要作用是把读取的数字音频信息转换成模拟音频信号输出,供功率放大重放。因此严格说纯音频解码器应称作D/A(数字/模拟)转换器。另一类即AV影音解码器,即平常所说的在“家庭影院”设备中使用的解码器,主要作用是把录音时经过编码的多声道音频信息作解码还原,经D/A转换后供功率放大重放。例如,朝更多的环绕声通道发展就是一个趋势。的一个技术趋势是增加了用于模拟立体声系统中的多通道音频的技术,以再造特别实况音乐会会场的“现场感”。于是产生了完成所有这些处理的挑战,因为你不再能用依靠AV接收器或DVD播放器内的大功率电源供电的DSP引擎来实现,而必须用靠手机或PDA中的电池供电的DSP引擎来实现。所有上述因素就为两个不同但却融合的应用领域(个人音频和家庭影院)带来了一个有趣的故事。尽管语音编解码器技术的发展一定程度上处于静止状态,但音频编解码器技术一直在向前演进(参见图1)。
个人音频
德州仪器公司(TI)便携音频和信息娱乐业务部技术官RandyCole指出,在个人音频领域普遍的音频编码解码器是MP3(参见图2)。MP3全称是动态影像压缩标准音频层面3(Moving Picture Experts Group Audio Layer III)。是当今较流行的一种数字音频编码和有损压缩格式,它设计用来大幅度地降低音频数据量,而对于大多数用户来说重放的音质与初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。MP3一度局限于PC和便携多媒体播放器,但它目前在手机行业中也比比皆是,其原因就是手机制造商不断地追逐新功能,以诱使终用户每隔六个月就进行产品换代。
MP3是ISO公布的一项标准。它是由MPEG制定的MPEG-1编码解码标准系列中的第三个。MPEG-1有三层,每一层都包括前面的层。因而,第3层实现了第1和2层。出于这个原因,MPEG-1及第3层就是众所周知的MP3,它提供了一个适于便携应用的带宽和数据速率,虽然较低却足够了。
简单地说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。MP3是利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
因此,由于整个行业深深卷入MP3,没有一家公司愿意调拨资源为AAC这个新方案生产大量的音频节目,所以它衰败了。
一种大家熟悉的专有编码器是WindowsMediaAudio(WMA)。它主要用于PC,并在其中与MP3和AAC进行竞争。然而,从数据速率看,它很灵活(从低到高有适当的质量差异)。目前,还有WMA的多频道版本WMA-Pro,而且微软公司在2005年6月还发布了一种损耗更低的WMA。
其它重要的专有编码器就是DolbyDigital,也就是着名的AC3。这种编码器用于DVD和(美国的)数字电视。直到近,它的运行速率对互联网和手机来说还是太高。不过,需要补救的是一个把数据速率降得更低的新版本。
根据TI公司高性能音频业务部行销经理MohsinImtiaz的观点,在家庭影院领域主要的编码解码器是Dolby和DTS。Dolby公司发布的DolbyDigitalPlus瞄准了高清晰度DVD和广播市场。但是在MP3、AAC、WMA等便携标准之间有一定的交叉。针对下一代DVD,微软公司正在力推WMA。WMA(Windows Media Audio),它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。一般使用Windows Media Audio编码格式的文件以WMA作为扩展名,一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。
解析一个编解码器
我们看一篇在2004年10月音频工程学会年会上提交的论文,它描述的是DolbyDigitalPlus技术。
该论文说新的DolbyDigitalPlus编码解码器是基于DolbyDigital的较早版本,也叫AC-3。DolbyDigitalPlus或加强型的AC-3(E-AC-3)保留了元数据载运器、过滤器库和帧结构。目前的数据速率范围从32Kb/s到6.144Mb/s。在采样速率32KHz和六模块转换帧的条件下,数据速率控制的分辨率可达到每秒1/3位。(数据速率的分辨率正比于采样速率,反比于帧的尺寸。)
E-AC-3保留了AC-3的六个256系数转换帧结构,但它允许包含一个、两个和三个256系数转换模块的较短帧存在。其结果就是,音频传输可以在高于6?0Kb/s的速率下进行,这适合于某些限制了每帧数据量的DVD。
滤波器(filter),是一种用来消除干扰杂讯的器件,将输入或输出经过过滤而得到纯净的直流电。对特定频率的频点或该频点以外的频率进行有效滤除的电路,就是滤波器,其功能就是得到一个特定频率或消除一个特定频率。编码效率的提高还可以通过一个新的滤波器库、更好的量化、强化的频道耦合、谱扩展和一种名为“瞬态预噪音处理”的技术来实现。
当具有稳定特征的音频出现时,该滤波器库在现有的AC-3滤波器库之后加入一个二级DCT。这把六个256系数转换模块转换成一个单一的1536系数混合转换模块,且提高了频率分辨率。这个提高的频率分辨率与六维向量分量(VQ)及增益自适应分量(GAQ)结合在一起可以改进“难于编码”信号的编码效率,比如说黑管和大键琴。
VQ用于需要较低准确度的频带区。当需要更高准确度分量时,GAQ更有效率。在AC-3用一个高频单合成频道作为每个频道上高频部分的地方,加入相位信息和编码器控制的谱幅度处理能够让这个高频单合成频道处理较低的频率,从而减小了有效的编码带宽并增大了编码效率。
谱扩展是用频域上转换的较低频谱段代替了较高层的频率转换系数。该转换频谱段的谱特征通过转换系数的谱调制与原始的形式匹配。
由编码器计算并在E-AC-3位流中发送的元数据提供了后解码过程、时标合成处理所需的参数,时标合成处理使用了听觉情景分析技术。
后处理
用于音频编码解码器中后处理的专有算法与DolbyDigitalPlus这类压缩标准一样重要,它们对任何受许可人也相同。在这个领域中,这些算法对多频道标准携带的信息进行操作,从而把家庭影院转化成任何形式的收听场所:从一个巨大的教堂到一个爵士音乐俱乐部的户外摇滚音乐会。爵士乐(Jazz),一种起源于非洲的音乐形式,由民歌发展而来。爵士乐以多种形式呈现出繁荣景象,其乐曲风格极其耀眼,节奏一般以鲜明,强烈为主,从根源布鲁斯、拉格泰姆(Ragtime),经过新奥尔良爵士乐到Dixieland爵士乐、摇摆乐、主流爵士、比波普、现代爵士到自由爵士及电子爵士。
按照ADI公司SigmaDSP产品经理ThomasIrrgang的说法,后处理全都是围绕着OEM商追求一个“签名声音”的愿望开展的。OEM生产,即代工生产,也称为定点生产,俗称代工,基本含义为品牌生产者不直接生产产品,而是利用自己掌握的关键的技术负责设计和开发新产品,控制销售渠道,具体的加工任务通过合同订购的方式委托同类产品的其他厂家生产。之后将所订产品低价买断,并直接贴上自己的品牌商标。这种委托他人生产的合作方式简称OEM,承接加工任务的制造商被称为OEM厂商,其生产的产品被称为OEM产品。可见,定点生产属于加工贸易中的“代工生产”方式,在国际贸易中是以商品为载体的劳务出口。大概做成功这点的是THX公司。其它开展后处理研究的公司包括SRS、TruSurroundXT和TruBass。
在电视领域有包括BBE3D和BBEMP。还有一种专门用于电视的算法BBEViva,在电视中立体声话筒一般放置的非常近以便获得良好的立体声收听效果。
目前突出的是WAVES公司的MaxxBass算法,它大概也是的低音增强算法,因为它增强了正被处理材料中低音的主观感受水平,同时又不加入任何低频能量。低音增强在便携系统和电视机中正变得重要起来,这些设备不会给大的话筒驱动器留有大的空间。
Dolby公司在后处理领域以其VirtualSpeaker(虚拟话筒)和DolbyHeadphone(Dolby耳麦)算法而闻名于世。Dolby公司表示其技术复制了多个所以声音签名,包括反射,同时提供了串扰抵消,以便保持每个耳朵的环绕音质不被其它话筒的环绕音质所抵消。
当然,天下没有的午餐。诸如虚拟话筒这样的算法只能在一个相对小的室内空间(俗称“甜场”)中模仿缺失话筒的存在。在这个“甜场”之外,环绕信息崩溃了。该声音不算坏,但听起来它来自一个常规的双耳话筒设置,情况就是这样。
为了重新生成一个物理空间,Panasonic公司的网站上说,其HallMode(大厅模式)“再生了回响效果,使听众有一种空旷之音绕着自己传播的感觉,”而且它在“享受音乐厅内的交响乐表演时的效果尤其好。”一个雅马哈A/V接收器的评论家认为雅马哈(雅马哈 YAMAHA (JAPAN)雅马哈名字的由来是公司创始人山叶(雅马哈)寅楠的姓氏,于1887年创立。由于从年轻时就熟悉西方的科学技术,雅马哈初修理医疗设备,还修理风琴,终促成了雅马哈品牌的诞生。出于对事业前景的自信,雅马哈排除万难,创建了雅马哈风琴公司)的音乐厅“的确加入了额外的一维,使人感到声场的高度,‘音乐厅模式’甚至让你忍不住要尝试一下。对于令人喜爱的Mahler第四交响乐的立体声录音,‘音乐厅模式’给人一种亲临现场的感觉。”
房间修正
这个功能开始出现于2002年或2003年的高端多频道系统中,而且目前已经发展到处于价格/性能谱系中端的系统。它对一套公寓楼内家庭影院系统的用户满意度至关重要,因为在家庭影院系统中不可能对称设置左、右话筒,或者说房间内一堵墙的声学性能不同于它对面墙的声学性能。它也许对两频道设置的影响较小,但立体声系统一般说来对误调整和误校准不那么敏感。根据MPEG规范的说法,MPEG-4中的AAC(Advanced audio coding)将是MP3格式的下一代,尽管有许多创造和推广其他格式的重要努力。然而,由于MP3的空前的流行,任何其他格式的成功在目前来说都是不太可能的。MP3不仅有广泛的用户端软件支持,也有很多的硬件支持比如便携式媒体播放器(指MP3播放器)DVD和CD播放器。MP3的播放跟DVD不一样。
执行软件以验证其满足指定的需求并检测错误的过程。检测已有条件之间的不同,并评价软件项的特性软件项的分析过程。软件工程过程的一个活动,它将软件在预定的条件下运行以判断软件是否符合预期结果。 房间修正涉及到把该系统调整为TEST(测试)模式,在喜欢的倾听位置处放一个麦克风,并播放出一系列测试声音以便弄清楚房间声学性能方面的信息和话筒本身的局限性,随后根据专有算法调整增益和均衡度。对于房间整定技术,一个令人感兴趣的交叉领域是汽车应用。多年来,一直在对昂贵汽车内OEM的音响系统进行声学调整以便获得性能,但这是一个相当费力而且相当主观的人工过程。
汽车制造商已经开始采用自动的听觉空间调整。实践证明,除了丰富的听觉经验外,这类调整一个重要的方面就是声学上的回音抵消。这意味着消除从免手拿话筒到安装在太阳帽或头顶处麦克风的反馈。
手机和个人多媒体设备的融合
MP3和AAC数据速率对个人多媒体播放器及PC是恰当的。但对于手机来说,数据速率必须要低一些。而且显而易见的是,与音乐文件以便稍后播放相比,通过蜂窝网链接的流音频有着很不同的需求。MP3播放器都是由两块或两块以上的线路板组成,线路板与线路板之间多使用插排件进行连接,在经过长时间使用后,这个插排有可能会出现接触不良现像,而由此带来的故障现像可能是多种的,严重时就根本无法开机。当然这样的问题一般维修也比较简单,可以直接将插排拔下,然后使用毛刷沾上无水酒精进行清洗,反复清洗几次后便可以把触点的接触不良现像去除,如果还是无法使用,可出售给回收电子的企业,让其进行环保处理。
由第3代合作规划委员会(3GPP)制订的3G手机标准采用AAC作为音频编码解码器标准,可满足了这两类应用的要求。该标准的修改版(版本6)允许使用两种音频编码解码器中的任何一种。一种就是AAC的强化版,叫做AAC-Plus或高效率AAC(HE-AAC)。
前不久,强化AAC-Plus或高效率AAC的第二套改进版(版本2)也添加进来。另一种选择是“AMRWidebandPlus”,它是一种强化的语音编码器。
苏格兰的Wolfson微电子公司从事硬件音频编码解码器的制造,该公司新产品开发部的副总裁PeterFrith指出,给手机加入回放MP3的功能,或者用于音乐,或者作为高质量的铃声,意味着用户已经希望在手机中看到一个相对高保真的回放系统。因此,手机制造商目前期盼出现功耗甚至更低的便携式DAC,且能够达到100dB的信噪比。
目前,带多媒体功能的手机只能播放MP3。MP3是一个数据压缩格式。它丢弃掉脉冲编码调制(PCM)音频数据中对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩),从而达到了小得多的文件大小。下一步要做的也许是个人多媒体播放器,它们能把手机的功能和蓝牙及Wi-Fi技术结合在一起。在此期间,PDA电话已经逐步进入领域,它提供了一些播放视频或音频文件的功能。
那是你口袋里的合唱队吗?
Frith还表示,在过去,设计人员提供的手机只有非常简单的铃声或者MIDI铃声功能。有了MIDI,硬件解决方案总的来看已经发展成一个独立的MIDI解码器芯片。
雅马哈是个典型的例子,芯片对MIDI文件进行解码,并将解码结果转换成PCM音频文件,随后通过一个DAC把它们播放出来。这个DAC也许可以集成进该解码芯片之中,当然也可以是分立的。做到这点的一个替代方法是把软件MIDI解码器植入电话处理器之中。
用户对播放高质量铃声的兴趣已经导致日本市场上的某些电话为其铃声选用了MP3文件。在MP3[1]中使用了许多技术其中包括心理声学以确定音频的哪一部分可以丢弃。MP3音频可以按照不同的位速进行压缩,提供了在数据大小和声音质量之间进行权衡的一个范围。
在目前的大部分电话之中,这个高保真系统是一个独立的芯片,它含有一个立体声DAC、一个立体声ADC、若干耳机和扬声器驱动器、麦克风预放大器等等。但类似Wolfson这样的公司目前寻求把所有这一切都集成在一起,以便该处理器可以实现语音播放和铃声、语音信号、蓝牙连接以及更多的功能(参见图3)。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。