基于传声器阵的两级自适应滤波语音增强系统

时间:2007-04-29

基于传声器阵的两级自适应滤波语音增强系统

纪元法,刘庆华,陈紫强,徐亚宁

1 引言

语音通信过程中,各种各样环境噪声的干扰使接收者接收到的语音是带噪声的语音信号,因此需进行语音增强。语音增强的一个主要目标就是从带噪语音信号中提取尽可能纯净的原始语音。

VLSI技术的发展和高速DSP芯片的出现为语音增强实时处理提供了可能,使语音增强技术走向实用。尽管其在理论上还有待发展,但某些增强算法已证明是有效的。目前,具有一定代表性的语音增强方法有:自适应噪声对消法、谐波增强法、基于参数估计的语音再合成法、基于语音短时谱估计的增强算法、基于传声器阵语音增强算法等[1]。

基于均方误差(Minimize Mean Square Error,MMSE)自适应噪声对消(ANC)是较为广泛应用的一种语音增强方法。该系统不基于任何信号模型假设,不需要知道语音信号及噪声的先验统计知识,算法简单、运算量小、实现容易。在ANC系统中,假设主通道输入为期望语音信号和噪声信号,参考输入信号只由与主通道的噪声分量相关的噪声成分组成。但在实际环境下很难做到,一般来说只有2个传声器距离较近时所采集的噪声有强的相关性,而这时参考信号中也必混有期望语音信号。当2个通道的输人均是有用信号和噪声的混合时,系统的性能就大大地减弱了,输出的语音信号必受到严重损伤"。

笔者提出一种新的基于传声器阵的两级自适应滤波结构。该结构不局限于传统ANC系统的假设,而是每个通道中均含有语音信号和噪声,但基于各个传声器上噪声之间的弱相关性条件,先通过第1级自适应滤波,得到其中一个通道中噪声的估计,而不含语音信号;再利用该信号对该通道进行第2级自适应噪声抵消,分离出增强的语音信号。

2 传声器阵语音增强系统

2.1 两级自适应滤波传声器阵系统结构

图1是传声器阵语音增强系统框图。传声器阵在一个平面上摆成正多边形,语音源正对平面,并调整到每个传声器的直线距离近似相等,即正多边形中心的垂线上。通常情况下,说话者到传声器阵的距离较近,各个传声器所采集到语音信号是强相关的。一般背景噪声为多个独立的复杂噪声源,噪声源到传声器阵的距离相对比较远,当传声器之间的距离较大时,各个传声器所接 收到的噪声分量可近似看作不相关[2],[5],[6],[7]。

通过调整每个传声器通道的延时单元T,使每个传声器所接收的语音信号同时到达。这样,每个传声器上经延时单元后的信号可表示为[6],[7]
xi(n)=s(n)+ni(n),i=1,2,…,M(1)

其中,xi(n)表示传声器上经延时对准后的信号,这里称其为传声器信号;s(n)表示语音信号分量;ni(n)表示各个传声器上的噪声分量;这里s(n)与ni(n)互不相关,且ni(n)之间互不相关;n为时间采样序列。

2.2 第1级自适应滤波器

该系统的两级滤波器H和W均采用有限长(FIR)横向滤波器结构。第1级滤波器"处理的是主输人为第1~M个传声器信号的平均,参考输入为第1~M-1个传声器信号的平均,即


可见,参考输入信号u(n)只与主输入信号v(n)的第1部分分量相关,而与nM(n)/M不相关。显然,根据MMSE,经图示的自适应滤波处理,语音信号s(n)和n1(n)~nM-1(n)噪声分量基本完全滤除,误差信号eM(n)就是第M通道中噪声分量nM(n)的估计,即

eM(n)=v(n)-u(n)=v(n)-H(n)UT(n)=nM(n) (4)

其中,nM"(n)表示nM(n)的估计;UT(n),H(n)分别是滤波器输人数据和滤波器权系数的矢量表示。取滤波器"和W的权系数长度均为工,则有UT(n)={u(n)u(n-1)u(n-2)…u [n-(L-1)]T(5)
H(n)=[h1(n)h2(n)h3(n)…hL(n)] (6)

这样,通过第1级自适应滤波器,得到了不含语音的信号eM(n),且是第M通道中噪声分量的估计。

2.3 第2级自适应滤波器

把第M通道的传声器信号xM(n)和第1级滤波器的误差信号eM(n)分别作为第2级滤波器W的主输入和参考输入,再进行自适应噪声抵消。因为eM(n)只是第M通道中的噪声nM(n)的估计,而与其中的语音分量s(n)不相关,所以该通道中的噪声分量nM(n)被对消,误差信号e(n)就是纯净语音信号s(n)的估计,这个过程可表示为
e(n)=xM(n)-eM(n)=xM(n)-W(n)ETM(n)=s(n)(7)

其中,s(n)表示表示纯净语音成分s(n)的估计;ETM(n)和W(n)分别是第2级滤波器的参考输入和滤波器系数的矢量表示,即
ETM(n)={eM(n) eM(n-1) eM(n-2)…eM[n-(L-1)]}T (8)
W(n)=[w1(n)w2(n)w3(n…wL(n))(9)

3自适应算法与仿真

3.1NLMS算法

2级滤波器都按MMSE准则设计系数。若采用Widrow-Hoff提出的基本LMS(Least mean square)算法,用W(n)表示滤波器的权系数,x(n)表示滤波器的参考输入信号,则滤波器权系数的通用迭代公式为[4]
W(n+1)=W(n)+2μe(n)x(n) (10)
其中,e(n)是滤波器误差信号,步长因子μ的取值范围为:0<μ<l/λmax,其中λmax为参考信号相关矩阵Rxx。的特征值。步长因子μ控制该算法达到解的收敛速度,μ值越大收敛越快,但若太大,算法变得不稳定。

LMS算法是定步长算法,故存在实时跟踪能力差,大误差信号区间会出现振荡的缺陷。人们一般利用变步长的思想来检验自适应算法的性能。这里采用了归一化LMS(Normalized LMS,NLMS)算法[8]:
W(n+1)=W(n)+μ(n)e(n)x(n) (11)
式中,μ(n)=α/n-1 ∑I=1x2(n-i)(12)

其中,μ(n)是步长,α是步长参数。较好的步长值可通过改变α得到。μ(n)能及时调整步长,保证算法稳定收敛。仿真结果证明了这一点。
3.2实验仿真

笔者采用NLMS算法进行了仿真。语音为一段标准男音;噪声源为4个互不相关高斯白噪声序列,即M=4,仿真结果如下。图2为清洁的语音信号s(n);图3为第M通道的含噪语音信号,即xM(n),语音信号基本淹没在背景噪声里,经主观试听,背景噪声非常刺耳,难以听懂话音;图4是经自适应滤波后的增强语音信号。从图上看,语音波形已十分清晰,主观试听,发现背景噪声基本消除,消噪效果明显。

4 小结

基于传声器阵的2级自适应语音增强系统结构,巧妙地利用M个传声器信号和M-1个传声器信号的差别,经第1级自适应滤波器估计出第M通道的噪声信号,再对第M通道的含噪语音信号进行自适应噪声对消,分离出纯净语音信号,从算法分析和仿真结果看,在信噪比较低情况下,该方法仍十分有效。



  

参考文献:

[1]. ANC datasheet https://www.dzsc.com/datasheet/ANC_2445562.html.
[2]. n-1  datasheet https://www.dzsc.com/datasheet/n-1+_1997158.html.


上一篇:移动定位技术综述
下一篇:一种基于频率选择的周期噪声无模型反馈控制

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料