1引言
当我们展望数字化播出所带来更完美的听觉感受时,作为电视节目播出机构,必须对声音播出的基本要求有一个重新审视,需要研究数字音频的播出将会对受众带来何种审美感受。在模拟或模拟数字混合播出的时代,许多电视播出机构对播出节目中音频内容不够重视,满足于只要有声音就行,对播出过程中出现的音质缺陷、响度的大幅度跳变未加有效的控制,其中,播出时不同节目源声音电平差异带来的较大响度跳变,以及各播出单位对电平标准把握不严带来频道间响度的大幅跳变,终还原后节目响度不可预知的大幅变化,让受众感到不适、烦躁甚至惊吓,事实上已经影响到节目播出的效果。
2电视音频播出的现状
近几年来,电视台播出系统已经大多改为数字标清播出,播出方式为视频服务器结合传统直播通道及磁带备播,在节目素材方面,大多从前期采集到后期制作都是数字格式,一部分传统的模拟磁带通过格式转换依然会用来播出。
通常,电视台播出系统中对音频处理不做处理,完全依赖于节目素材本身的质量,很多电视台专门成立技术审查部门对磁带信号做技术把关,但是由于音频技术化程度很高,对于音频的把关通常非常粗糙,离音频的优质播出相差很远。有一部分电视台在播出系统的出口增加了压缩限幅处理设备,由音频人员调整并固化参数,以改善音频播出的质量,这是很有必要的,在一定程度上有效地控制了音频播出的电平。
传统的音频系统以及的播出,我们使用VU表来测量音频电平,数字系统使用峰值表严格控制和检测峰值。响度,这个非常复杂却极其重要的声学概念,在制作领域或播出领域极少有人注意,当我们一心专注于控制节目的电平时,对节目响度的异常却没有什么好的办法,很多节目如广告及老版的模拟节目内容,由于制作阶段严重的压缩限幅处理,电平非常标准,可是还原出来的响度严重破坏了频道整体的平均响度水平,问题的解决刻不容缓。
我们认为,不管数字化播出能给我们带来多少声音传输技术的优越性,对节目响度控制这一基本要求,依然需要加以特别重视。
3需要重申的几个基本概念
(1)声音(Voice),能被人耳所感知的称之为声音,它由空气振动形成,会沿着一定方向进行扩散、折射或反射。
(2)音频信号(Audio),用话筒一类的声能转换器,可将声音转换为电信号,就是我们熟悉的音频信号,音频信号频率范围为20Hz~20kHz,大小用音频信号电压或功率的分贝数表示,常见的电平单位有dBu、dBr、VU和dBFS等。目前模拟或数字音频技术可处理的信号幅度已经无限接近电子理论上的-123dBu。在声-电转换过程中,电子电路将不可避免的带来一些失真和附加噪声。可用谐波失真+噪声(THD+N)指标衡量,越小越好。
(3)噪声(Noise),对我们来说需要听到声音就是信息,其他声音可以认为是噪声,这就是环境噪声或本底噪声的概念。不同的环境噪声,将对有用信息产生选择性,有些有用的信息可能会被环境噪声淹没。二者之间的相关性,后面将有详细论叙。
(4)响度(Loudness),电信号转换为声波振动时度量声音能量的一个指标,我们经常说的音量其实就代表了响度。响度是一个复杂的声学仿真概念,用一个鲜为人知的单位(sone)来标示大小,和声压级、频率有密切关系,我们不必拘泥于严谨的物理声学定义,只要理解响度代表声音的平均能量以及响度的舒适度与声音的声压级有关就够了。
通常,一些非音频的技术人员容易将电平和响度混为一谈,错误地理解为控制电平就是控制了终还原的响度。实际上,电平本身的度量有多种方法,如VU表、ppm表、dBFS表等,接近人耳听觉特性的是VU表,VU表指针或条状图的摆动特性可以大致描述信号还原为声音时音量的变化,也就是人耳终感觉到的响度变化,但也只是大致,并非特别准确,如果用ppm或dBFS数字表,则可能偏差更大,原因在于表头的响应特性,只有VU表响应于音频信号的准平均值,接近于听觉特性,其余都是响应于音频信号的峰值或准峰值,这类表头通常只对控制信号的峰值有用。而响度的测量,过去一直借助于仿真的方法,过于刻板和不便,很少有音频制作或电视播出部门参考响度的测量。
近年来,一些的音频厂商加强了对响度测量及控制的重视,他们用DSP处理的方法,直接分析音频信号,给出信号还原时标准的响度值并用传统的电平表示(响度电平)。当然不同厂商在对信号分析时采用的方法有所不同,各大标准化组织也并没有统一标准,尽管这很有必要,可出于商业上面的考虑,出现这种状态是正常的。但就我国而言,由广电总局选择一种标准进行推广普及,指导全国音频制作和播出系统对节目的响度进行控制,应该说非常必要,不像过去依靠电平表的情况,响度测试仪给出一段时间内响度数字化值,不合适时简单控制一下电平就可将响度控制在特定的水平。
(5)动态范围(Dynamic Range),人耳可感知的声音在很窄20Hz~20kHz频率范围,但是动态范围非常大,自然界从可感知的微弱的声音到耳膜无法承受的声音,动态超过145dB,更大的声压可感知会伤害听觉。如此宽的动态范围,在转换为电信号时,很难被忠实记录及还原。当然,随着电子技术的发展,这一局限已经越来越小但并未根本解决,我们只有通过调音师手动控制或压限器之类的电子设备,对信号动态范围加以合适的压缩,保证在采集、存储和传输过程中不出现失真,在此基础上尽可能保持原有的动态范围。大的动态范围是HI-FI高保真音频的追求目标,音频工作者为此不懈努力,但对电视播出而言,却有相应的问题需要解决。
4电视播出系统中音频技术的特殊要求
与Hi-Fi领域不同,电视播出面向各种接收环境尤其是家庭和公共场所,在这类接收环境里,通常缺少良好的声学条件,环境噪音差别较大。根据信号理论,信号只有在大于噪声时才能被提取出来,因此,还原大动态音频信号时,其中小于环境噪声的部分将被淹没掉,大的信号会被听到,有可能带来播放、传输、还原链路中某一个或多个环节中电子设备的幅频特性失真。 另一方面,各类节目源响度差异过大和频道间声音响度差异过大,将会使得电视观众或广播听众感到不舒服,统一响度和提供合适的动态范围,是电视及广播播出系统中需要解决的为重要的问题之一,这一特殊要求独立于音频的所有要求之外。
典型的模拟广播电视播出系统中有两类信号源,一类是磁带记录的模拟视频和音频信号,这类信号由于载体是磁带的原因,音频信号动态范围相对较小;另一类是由演播室通过铜缆或光缆传送的直播信号,动态范围可能大得多。为了平衡两类信号的动态以保证播出后具有较好的一致性,需要在播出末级加压缩限幅器及扩展器,对过大的信号进行压缩和限幅,对较小的信号进行幅度提升,预先设置好动作阈值,由设备自动处理,统一信号的动态范围,在一定程度上保证了音频信息传输的有效性。 数字化播出后,信号记录的载体变为数字磁带或硬盘服务器,对音频信号而言,由于从前期采集到后期制作都在数字域内完成,系统链路设备可承载的音频信号动态范围有很大改观,从模拟分量录象机的60dB到数字录象机的90dB动态,发射系统及有线电视传输系统数字化后也是这样,动态范围明显改善。播出传输系统设备的动态范围相继统一,那么接收情况如何呢?
接收方面分几种情况:
(1)数字卫星直接接收DVB-S、数字无线接收DVB-T、数字机顶盒接收DVB-C;
(2)无线模拟开路接收;
(3)其他接收方式,包括IPTV、手机电视等新媒体。
数字卫星、数字无线及数字机顶盒接收方式具备解调大动态范围音频信号的条件,根据发送端编码设备使用的压缩编码方式不同,接收端可以还原的动态范围也有些差异,但相比较无线模拟开路接收和低码流的新媒体接收方式而言,更加符合音频的要求。
终的音频信号还原也大致分几种,情况比较复杂:HI-FI家庭影院系统当然可以获得很棒的信号还原效果,问题是绝大多数电视接收观众是直接用电视机喇叭来还原声音的,优质喇叭系统可能还原的动态也许能达到较为理想的效果,而劣质喇叭系统就很难说,这一点相信每个听力正常的人都会有切身体验。其他还有一部分受众使用多媒体音箱、手机喇叭或耳机还原节目声音的,声音还原条件可谓千差万别。
接收条件和声音还原条件的差别,给广播电视节目制作、播出和传输带来相应的困难,显然,照顾绝大多数,尽可能让观众感到满意是我们应该做的。 对于同一接收条件而言,节目响度一致性问题需要得到高度重视,观众对声音感到不满意甚至厌烦,多是因为声音响度不一致,包括频道间和节目间的声音响度差别巨大。
面向特殊接收环境和还音条件千差万别的电视播出系统,在一个环节必须对声音的响度和动态范围进行必要的控制,这样才能保证接收信号还原时具有合适的舒适度、可懂度。而响度和动态范围控制具有一定的相关性,因而过去仅对音频信号进行限幅处理的方法,有很大的片面性。
5可供选择的响度及动态控制技术
今天,我们有多种技术可以选择,这几种主流的响度控制技术分别得到不同电视播出机构的认同,分别有自己的重量级用户,包括JUNGER公司的LEVE MAGIC R、杜比实验室的元数据技术以及TC公司的响度控制技术,甚至有芯片厂商参与其中,他们热哀于提供各种响度处理的大规模芯片,使得声音的响度处理变得更加容易。
5.1 T.C.Electronics
T.C.Electronics是一家传统的音频处理设备生产商,目前可以支持AES/EBU及SDI嵌入音频实时响度及动态范围处理的设备DB-4和DB-8在中央电视台播出线上使用,TC处理响度的独特之处在于它将响度和动态范围结合在一起处理,用户可以调用很多国外电视台在响度和动态范围处理方面的参考数据,然后根据自己素材的特点修改这些参数获得适合的播出效果。 5.2 Level Magic R
尽管响度和电平是两个不同的概念,但是二者具有一定程度的联系,前面提到,当我们用信号的准平均值来表示信号电平大小时,这时电平和信号还原出来的响度就具有较好的一致性,因此,通过高速检测信号的平均值电平,根据压缩扩展规则进行高速处理,可以比较理想地控制信号还原的响度,这就是Level Magic的基本原理。
Level Magic是德国JUNGER公司的技术,基于Level magic的设备目前支持大多数音频接口,包括模拟、AES/EBU、SDI嵌入音频,支持断电旁通,适合播出线使用。
5.3杜比实验室
杜比实验室在声音响度控制方面有长期的研究和经验积累,他们于2004年推出获艾米奖基于Leq(A)特性的LM100响度测试仪,并陆续提出了几种响度控制解决方案。
(1)元数据技术控制还原
杜比元数据技术的原理是,借助于在杜比数字(AC-3)或杜比E(DOLBY-E)数字音频流中加入标识音频信号响度的元数据,含元数据的音频信号到达接收端后,由接收端的机顶盒根据元数据决定信号还原时的音频增益大小,从而使得声音还原时具有合适的响度,同时动态范围并不压缩。
杜比元数据技术的特点是它不对信号进行任何处理,只是分析出节目信号的响度大小,响度值就是元数据的内容,机顶盒读取元数据并做出正确的响度还原。和其他一些厂商有所不同,杜比实验室的理念是内容提供商不能只照顾普通接受条件而牺牲那些具有高端接收条件的观众的满意度,通过对机顶盒的接收参数设置,各类用户得到各自需要的响度和合适的动态范围。 元数据技术应用的前提是用户接收的音频数据流中必须包含准确测量的响度数据(元数据)、音频数据流必须是杜比数字或杜比-E编码格式、接收端机顶盒支持元数据技术。
无可置疑,元数据技术相比较传统的音频信号处理具有明显的优越性,如果每个节目制作单位、每个频道都能应用杜比的元数据及编解码技术、每个用户都具备支持元数据的机顶盒或解码器,那么,我们目前面临的响度差异问题就可以完满解决,这真是太好不过了,至于动态范围,我们可以在播出系统的不同出口使用在线处理的传统方法解决。
(2)基于文件处理的DP600
杜比实验室可能已经意识到,元数据技术在中国推广具有不小难度,不用说目前国内的机顶盒厂商不支持元数据技术,就是现有广电音频系统的重建,难度也是可想而知,因而杜比在2007年又推出了基于文件处理的响度控制器DP600。
DP600按一定的策率从视频服务器读取素材,从中抽出音频数据流进行短期或长期响度分析,并把它调整到预先设定的响度水平,处理过后的音频流重新打包回去成为可以正确播放的文件。尽管对原始文件进行了响度处理,但依然不破坏原始文件的动态范围。如果所有播放的素材都是经过响度处理,这样大家的响度就一致了,这正是我们期待的结果。
(3)接收端直接处理(Dolby Volume)
和前两种处理不同,Dolby Volume直接面向消费类电子设备,对响度的控制完全独立于节目提供商和节目类型。杜比在2007年初推出Dolby Volume技术,很快得到了芯片厂商的积极响应,Cirrus Logic在2007年11月正式发布支持Dolby Volume技术的CS48DV2/6系列DSP处理芯片,相信2008年高端消费类电子很快就会出现支持这一技术的产品。
不管是元数据还是基于文件对响度进行处理,杜比实验室把它的响度控制技术命名为对白归一(DialNorm),这有点容易让人产生误解,因为事实上我们播出的音频节目形式多样,组成元素复杂.除了对白,还有独立的音乐、效果以及作为背景与对白混合的音乐和效果。那么为什么Dolby只关心对白呢?
根据杜比的研究,入耳对节目中的人声(也就是对白)相对于音效来说要敏感得多,并且不同的人对于同一段对白响度的认知度一致性非常之高,对白响度变化+1.0dB/-3dB,大多数人会立刻感觉到,响度变化超过+2.0dB/-5.0dB,大多数人就有不舒服的感觉,中间的容限很小,音乐则不同,容限超过12dB,并且不同的人对音乐响度的不一致性非常大,相信这个研究结果对大家会有很明确的启发:只要我们有效控制了节目中对白的响度,就不会让观众感到不舒服;如果能让所有节目中的对白和所有频道播出的对白响度一致,观众就不会对节目间和频道间响度的大幅度跳变感到厌恶。我个人认为杜比抛开音频信号复杂化的表面抓住关键因素的研究卓有成效,对音频处理技术的进步是一个贡献。
那些不含对白的节目怎么办呢?比如纯音乐、无人声的广告。由于人耳对这类信号响度的容差较大,关键还是控制其平均响度,同样可以采取对白归一化处理,如果需要对广告等特殊节目提高一定的响度,可以在对其归一化处理时采取偏移目标响度值的策率,将其响度适当提高0.5~1 dB,在一定程度上迎合广告投放商和音乐制作人,同时不至于得罪观众的耳朵。
6结语
以上分析了几种主要的响度控制技术,就我们当前大多数电视台节目制作和播出的情况来看,在线式传统的压限处理依然可以发挥作用,元数据技术应用离电视播出系统可能还很遥远,基于杜比对白归一的文件处理技术对于以硬盘播出系统为主的有很好的应用价值。
我们面临的任务具有紧迫性,不管采取什么方法,首先我们需要对当前播出响度的状况有准确的测量,需要准确了解各类型节目的平均响度,然后在一定方法的指导下,控制节目播出的响度,给观众带去更美好的听觉审美感受。庆幸的是,现在我们有了比较清晰的思路,尽管很难说哪种方案完美无缺,或许可以考虑结合各家所长,在不同的播出传输节点使用不同的处理方法,得到的结果是我们目标。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。