基于传声器阵的两级自适应滤波语音增强系统
纪元法,刘庆华,陈紫强,徐亚宁
2 传声器阵语音增强系统
2.1 两级自适应滤波传声器阵系统结构
图1是传声器阵语音增强系统框图。传声器阵在一个平面上摆成正多边形,语音源正对平面,并调整到每个传声器的直线距离近似相等,即正多边形中心的垂线上。通常情况下,说话者到传声器阵的距离较近,各个传声器所采集到语音信号是强相关的。一般背景噪声为多个独立的复杂噪声源,噪声源到传声器阵的距离相对比较远,当传声器之间的距离较大时,各个传声器所接 收到的噪声分量可近似看作不相关[2],[5],[6],[7]。
通过调整每个传声器通道的延时单元T,使每个传声器所接收的语音信号同时到达。这样,每个传声器上经延时单元后的信号可表示为[6],[7]
xi(n)=s(n)+ni(n),i=1,2,…,M(1)
其中,xi(n)表示传声器上经延时对准后的信号,这里称其为传声器信号;s(n)表示语音信号分量;ni(n)表示各个传声器上的噪声分量;这里s(n)与ni(n)互不相关,且ni(n)之间互不相关;n为时间采样序列。
2.2 第1级自适应滤波器
该系统的两级滤波器H和W均采用有限长(FIR)横向滤波器结构。第1级滤波器"处理的是主输人为第1~M个传声器信号的平均,参考输入为第1~M-1个传声器信号的平均,即
可见,参考输入信号u(n)只与主输入信号v(n)的第1部分分量相关,而与nM(n)/M不相关。显然,根据MMSE,经图示的自适应滤波处理,语音信号s(n)和n1(n)~nM-1(n)噪声分量基本完全滤除,误差信号eM(n)就是第M通道中噪声分量nM(n)的估计,即
eM(n)=v(n)-u(n)=v(n)-H(n)UT(n)=nM(n) (4)
其中,nM"(n)表示nM(n)的估计;UT(n),H(n)分别是滤波器输人数据和滤波器权系数的矢量表示。取滤波器"和W的权系数长度均为工,则有UT(n)={u(n)u(n-1)u(n-2)…u [n-(L-1)]T(5)
H(n)=[h1(n)h2(n)h3(n)…hL(n)] (6)
这样,通过第1级自适应滤波器,得到了不含语音的信号eM(n),且是第M通道中噪声分量的估计。
2.3 第2级自适应滤波器
把第M通道的传声器信号xM(n)和第1级滤波器的误差信号eM(n)分别作为第2级滤波器W的主输入和参考输入,再进行自适应噪声抵消。因为eM(n)只是第M通道中的噪声nM(n)的估计,而与其中的语音分量s(n)不相关,所以该通道中的噪声分量nM(n)被对消,误差信号e(n)就是纯净语音信号s(n)的估计,这个过程可表示为
e(n)=xM(n)-eM(n)=xM(n)-W(n)ETM(n)=s(n)(7)
其中,s(n)表示表示纯净语音成分s(n)的估计;ETM(n)和W(n)分别是第2级滤波器的参考输入和滤波器系数的矢量表示,即
ETM(n)={eM(n) eM(n-1) eM(n-2)…eM[n-(L-1)]}T (8)
W(n)=[w1(n)w2(n)w3(n…wL(n))(9)
3自适应算法与仿真
3.1NLMS算法
2级滤波器都按MMSE准则设计系数。若采用Widrow-Hoff提出的基本LMS(Least mean square)算法,用W(n)表示滤波器的权系数,x(n)表示滤波器的参考输入信号,则滤波器权系数的通用迭代公式为[4]
W(n+1)=W(n)+2μe(n)x(n) (10)
其中,e(n)是滤波器误差信号,步长因子μ的取值范围为:0<μ<l/λmax,其中λmax为参考信号相关矩阵Rxx。的特征值。步长因子μ控制该算法达到解的收敛速度,μ值越大收敛越快,但若太大,算法变得不稳定。
LMS算法是定步长算法,故存在实时跟踪能力差,大误差信号区间会出现振荡的缺陷。人们一般利用变步长的思想来检验自适应算法的性能。这里采用了归一化LMS(Normalized LMS,NLMS)算法[8]:
W(n+1)=W(n)+μ(n)e(n)x(n) (11)
式中,μ(n)=α/n-1 ∑I=1x2(n-i)(12)
其中,μ(n)是步长,α是步长参数。较好的步长值可通过改变α得到。μ(n)能及时调整步长,保证算法稳定收敛。仿真结果证明了这一点。
3.2实验仿真
笔者采用NLMS算法进行了仿真。语音为一段标准男音;噪声源为4个互不相关高斯白噪声序列,即M=4,仿真结果如下。图2为清洁的语音信号s(n);图3为第M通道的含噪语音信号,即xM(n),语音信号基本淹没在背景噪声里,经主观试听,背景噪声非常刺耳,难以听懂话音;图4是经自适应滤波后的增强语音信号。从图上看,语音波形已十分清晰,主观试听,发现背景噪声基本消除,消噪效果明显。
4 小结
基于传声器阵的2级自适应语音增强系统结构,巧妙地利用M个传声器信号和M-1个传声器信号的差别,经第1级自适应滤波器估计出第M通道的噪声信号,再对第M通道的含噪语音信号进行自适应噪声对消,分离出纯净语音信号,从算法分析和仿真结果看,在信噪比较低情况下,该方法仍十分有效。
[1]. ANC datasheet https://www.dzsc.com/datasheet/ANC_2445562.html.
[2]. n-1 datasheet https://www.dzsc.com/datasheet/n-1+_1997158.html.
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。