嵌入式系统中的IIS音频接口技术

时间：2011-09-05

　　音频接口是连接麦克风和其他声源与计算机的设备，其在模拟和数字信号之间起到了桥梁连接的作用。音频接口通常与前置麦克风、线路输入和其他一系列的输入设备配合使用。

　　1 IIS总线

　　IIS（Integrate InteRFace of Sound）即集成音频接口，在上个世纪80年代首先被Philips公司用于消费产品的音频设备，并在一个称为LRCLK（Left／Right CLOCK）的信号机制中经过多路转换，将两路音频信号合成单一的数据队列。当LRCLK为高时，左声道数据被传输；LRCLK为低时，右声道数据被传输（也可以反过来，高低与左右声音的对应可以自定义）。对于多通道系统，在同样的BCLK和LRCLK条件下，并行执行几个数据队列也是可能的。由于IIS、PCM和类似的音频接口不能提供寄存器入口，因此需要独立的控制接口。

　　IIS总线一般具有4根信号线，如图1所示，包括串行数据输入（IISDI）、串行数据输出（IISD0）、左／右声道选择（IISLRCK）和串行数据时钟（IISCLK）；产生IISLRCK和IISCLK的是主设备。

　　2 IIS音频驱动实现

　　音频驱动有3种模式：MDD／PDD模式、Wavedev2模式、UAM模式。它们相同的地方很明显：接口相同，都是流驱动，透过流接口与上层的waveapi.dll交互。

　　第1种MDD／PDD模式是早的模式，也是其他驱动常见的分层模式。如果使用CE提供的MDD（wavem—dd.1ib），会受到一些限制：仅支持一个设备；一个设置仅支持一个流；对循环的支持不大可靠；对流的支持较弱。当然，由于提供了源码，可以自己修改MDD，突破以上这些限制。

　　第2种Wavedev2模式，是因为2000年的Smartphone项目产生了新的要求，这些需求需要大改MDD／PDD。比如上面的限制2，根据CE的开发历史，此时waveapi.dll也不支持software mixer，这就是说只能同时允许一个应用在播放。所以根据当时情况，CE的多媒体开发团队设计了Wavedev2模式。这是一个单体（不分层）的驱动模式，平台相关的模块都在hwctxt.h和hwetxt.cpp中，此外还加入了midi支持、software mixer支持、S／PDlF接口、gain class接口、forcespeaker接口，等等。因此，开发Smartphone或者PPC，这个模式是挺适合的。

　　第3种UAM模式，即统一音频模式（Unified AudioModel），在开发WinCE4.2时，要增加对DirectSound的支持，而且有一些音频设备是支持硬件mixer的，对此使用UAM是很好的选择。

　　本测试采用MDD／PDD的驱动结构，下面讲述本驱动的关键点。

　　2.1 DMA控制及驱动

　　通俗地讲，DMA（直接内存存取）不需要CPU干扰也不消耗CPU资源，可以把音频数据自动地从系统总线搬到IIS总线上；如果音频平均按采样频率44.1 kHz、16位字长、左右2声道计算，码流为1.411 Mbps，通常在1～3Mbps，所以采用DMA传输十分必要。

　　2.2 时钟配置

　　只要位时钟和采样时钟能匹配好，IIS数据格式主从一致，DMA配置好，音频就可以工作了。

　　IIS数据格式主要分3种：左对齐、右对齐、IIS格式。声音听起来“怪怪地”，就是数据格式不对。频率计算方法如表1所列。

　　IIS主设备时钟频率可以通过采样频率来选择。IIS主设备时钟频率是由IIS预分频器产生的（IIS主设备时钟频率=MCLK／预分频器值），因此必须选择合适的预分频器的值和CODECLK的采样频率类型（256或者384fs），才能获得合适的IISLRC采样频率（IISLRCK频率=IIS主设备时钟频率／CODECLK的采样频率类型）；串行位采样频率类型（16／32／48fs）可以通过配置每个通道的串行位数和CODECLK采样频率类型来完成，它们之间的关系如表2所列。

　　如晶振频率为16.934 4 MHz，通过384分频为44.1kHz（采样频率就是这么来的）。

　　位时钟频率=采样频率×数据位×2=44.1 kHz×16×2=1.411 MHz

　　对于其他频率的晶振或是来自于总线的时钟频率，就要计算出IISC0N中的分频系数了，以限度拟合CODECLK。

　　2.3 CODEC控制

　　目前有SPI、I2C和L3三种总线控制CODEC。L3总线（L3MODE、L3CLOCK、L3DATA）都是由通用的I／O端口来控制的。其中L3接口实际上是一种串行接口，它由3根信号线组成，完成处理器和C0DEC之间的数据和控制信号交换。UDAl341TS就是采用L3接口的。

　　L3DATA：处理器接口数据线。

　　L3MODE：处理器接口模式信号线。

　　L3CLOCK：处理器接口时钟信号线。

　　三种控制方式中以I2C为常见。其中I2C又分为寄存器方式和I／O模拟方式两种，I／O模拟方式的可移植性好，仅I／0模拟方式的I2C驱动又可分为8位、9位、16位，以及是否带子地址、是否可以连读连写、是否要兼容SCCB总线。

　　2.4 音量控制节点

　　使用音量调节的地方较多。图2是音量控制节点的一般模型。

　　①处的增益由播放器的音量控制功能决定，是0dB。也就是说，多只能还原出原信号强度。

　　②和③处的增益由Coded IC自身控制，WM8731没有产生增益功能，②处容易引入信号失真，一般置为O dB，codec加大音量时主要在③处提高增益。

　　④、⑤处由功放决定，也是O dB，便携式功放通常是电流型，靠放大电流去推动扬声器。

　　①+②+③三处的增益和超过O dB时，1 kHz的信号就会产生失真，但是大部分音乐的强度都小于1 kHz测试方波时的强度，所以这三项的和可以比O dB略大，但不能太大，否则会引起信号失真。

　　a.应用程序通过调用waveOutSetVolume，与手工在控制面板中调节音量等效。

　　b.调节MediaPlay播放器音量时，通过消息跟踪可以判断是否改变了①处的增益，即ARM的DSP数字输出增益。

　　c.调节控制面板里的音量时，会发现CODEC的功放寄存器值也会改变。猜想是通过IIS总线实现控制相关寄存器，因为在IoControl消息中没有发现通过I2C改写任何寄存器。

　　通过分析调整音量的方法，有图2所示的5个节点可控制，目的是音量失真：让①处输出增益的情况下，②处PCM Volume置为0 dB（此处放大容易引入失真），功放置时便能获得不失真音量了；如果想再增大音量只能牺牲失真度了，人耳多接收10％THD（Total Hamonic Distortion，总谐波失真），此种情况下主要靠调节③处的增益。

　　3 提高音量的有效方法

　　①在C0DEC与功放不可更改的前提下，选择合适的喇叭至关重要（不同的喇叭效果大不一样）。口径大小不等，纸盆有深有浅。在选择喇叭时一般要求功放的额定功率是喇叭额定功率的2倍以上，喇叭的实际承受功率是其额定输出功率的2～3倍。喇叭的灵敏度参数很重要，一般是O.1 W时85 dB左右，还要看额定功率时的灵敏度。灵敏度用来衡量将电能转换为声音的效率，只讲额定功率不讲额定功率时的灵敏度是没有意义的，额定功率下的低灵敏度无益于电阻丝“发热不出声”。

　　②提高功放电压，根据P=U·U／R，很小的提升电压，就能获得平方级的功率提升。如由4 V→6V，功率可提高2.25倍。

　　③改善音腔设计。

　　④原则上不建议以牺牲保真度来换取音量。如不得已而为之，使用时也要严格控制在THD<10％。

　　3.1 功放与扬声器的匹配和选择

　　功放的输出功率一定要大于喇叭的输出功率，否则不但会影响声音效果，而且会加速功放的损坏。如选择的喇叭阻抗比功放的输出阻抗高时，将影响放大器的输出功率；而当喇叭的阻抗过低时（如低于4Ω），使用的功率放大器与额定的输出功率又不相匹配，这种情况下失真将增大。如果喇叭的阻抗符合要求，额定功率又比功放的额定功率稍小，失真就相对小，喇叭的声音质量就好。

　　扬声器的选择：

　　①口径大，纸盆深，转换效率就高，承受功率也越大；口径小，纸盆过浅，高频响应就不好。

　　②用手轻按同样口径的纸盆时，比较费力的扬声器谐振频率高，动态范围较大。

　　③坚硬、密实纸盆的扬声器，高频性能一般较好；粗疏、柔软纸盆的扬声器，音质一般较柔和。

　　④放大器应该有足够的功率输出，尤其是晶体管放大器。扬声器的输出功率应该是其额定功率的3倍以上，并且扬声器的输入功率应该等于放大器的输出功率，以保护扬声器的安全。

　　⑤阻抗匹配是基本的要求：对于Class D类功效，由于PWM易引起高频干扰，因此还要考虑合适的感抗，以起到滤波作用。如图3所示，线圈的阻抗和感抗组成了一个低通滤波器，理想情况下将阻隔PWM产生的高频谐波干扰。这里选择增益为一3 dB时的频率作为高频的截止点fc=RL／2πL。当阻抗为8Ω时，令截止频率为20kHz，则有L=RL／2πfc=8Ω／（2π×20 kHz）=64μH。8 Ω的便携式扬声器感抗为20～100μH。如果实际感抗>64μH，将限制带通特性；如果实际感抗<64μH，截止频率会>20 Hz，此时又会引入噪声。所以，选择扬声器时感抗要尽量接近64μH；对于AB类功放，则不作严格要求。

　　3.2 音腔设计

　　好的音腔，同样的功率下，音量会更大。

　　①音腔内要平，不要有高低不平的落差感。

　　②出音孔是音腔面积的15％～20％（手机中常用的）。

　　③音腔要尽量深，形成“V”型出音，效果较好。

　　④前后音腔要隔开，以免前后声音互相干扰。这个原理和喇叭放出的声音比起喇叭装在箱子里面的声音要小很多的原因一致。

　　⑤前音腔：扬声器前面音腔的大小主要由扬声器上面的泡棉高度所决定，一般来说至少要留O.2 mm的泡棉。前音腔主要对高频声音有所影响，对于SPL（SoundPressure Level，声压级）影响不是太大。

　　⑥后音腔：要足够大，如果能够达到手机喇叭的等效声容积的2倍的水平；更大的后音腔使得扬声器在低频可以得到更好的效果。

　　⑦前音腔和出音孔要设计合理、恰当：前音腔和出声孔形成一个Helmholtz共鸣器，会在某个频率点出现谐振峰。若不是特殊设计，可以把该谐振峰调整到高频端（>10 kHz），相应地就要求前腔浅，出音孔面积大；若有特殊设计要求，譬如为了提高响度，可以把谐振峰调整到3.4～6 kHz，不过带来的结果将是声音偏单调，而且对音源的要求会苛刻。

　　⑧密封性：基本的是要让扬声器的前音腔和后音腔分开，保证良好的密封性（尽可能地保证手机音腔的密封性）。良好的密封性使得扬声器在低频段可以得到更好的效果（可以得到更大、更柔美的声音）。

　　4 音效测试

　　由于人耳对音频发声的感官不尽相同，且主观差异较大，曾想写一篇文章，专门介绍音效的评测及控制方法，需控要什么样的仪器，实验方案如何。但由于实验条件和本人能力有限，加上性很强，不敢写也怕写不好，只好作罢。以下是Wolfson Microelectronics plc Jason Fan所列（仅供参考），同时期待这类文章早日出现。

　　①基本仪器：稳压电源、内置滤波器的毫伏表（可以测量输出的噪声和输出的功率）、失真仪、声压仪、信号发生器。

　　②仪器：AP音频分析仪、音频全频扫描仪（用来测试扬声器功率）。

　　③音频系统的评估指标有基本指标和升级指标。

　　基本指标有：输出功率、信噪比、频率响应、失真度、左右通道分离度、左右声道平衡度。

　　升级指标（需使用音频分析仪测量）有：THD+N、动态范围、FFT。

　　作音频测试时，一般会使用一些标准的测试信号，如左右声道1 kHz O dB；左右声道30 Hz O dB；左右声道100Hz 0 dB；左右声道10 kHz 0 dB；左右声道16 kHz O dB；左声道l kHz O dB；右声道1 kHz 0 dB。

　　上述仪器都会附带使用方法和实验方案。

　　5 总结

　　面对音视频驱动，首先不要有畏惧心理而觉得其高深莫测不敢去接触。掌握基础原理和上述要点后，一般的IIS音频CODEC均能驱动。在本人驱动WMXXX系列（WM9712／WM8978／WM8960／WM8731）、UDAl314、PCMl770、UCBl440、CS4344等芯片的过程中，均得到了有效验证。

　　在应用CS42L52时，发现背景噪声明显，但耳机音质很好，说明噪声来自于功放；一上电不做任何初始化照样有，进一步说明来自功放，而且不随音量改变而改变。不能正面降噪，后来采取的规避措施是：没有DMA传输时关掉声音通道，此问题后来通过新老电路板对比，查出是扬声器的输出端所接LC回路中电感参数不当产生了自激。把电感换成O Ω电阻后，噪声基本消除。

　　在ARM中，晶振以12 MHz和16.934 4 MHz为常见（视频系统中也有27 MHz或28.XXX MHz），系统外围总线是50 MHz，能不能配成精准的44.1 kHz或48kHz，要视各芯片自身的PLL了，这一点要格外重视。如果频率相差太多，也会引入噪声且有语速不正常现象。

上一篇：小区监控方案设计

下一篇：浅谈嵌入式系统的开发利器─Windows CE操作系统