-4695-
0引言
在语音通信过程中,语音信号会不同程度地受到各种各样的干扰,影响了语音的质量与自然度。因此需要从带噪语音信号中提取尽可能纯净的原始语音,对带噪语音信号进行语音增强处理。在平稳的声学环境及信噪比较大的情况下的语音增强比在非平稳的声学环境下,低信噪比的含噪语音信号的增强处理起来要复杂得多。
目前常用的基于短时幅度谱估计语音增强算法有减谱法、维纳滤波法和最小均方误差估计的方法等,这些方法都能够降低噪声,但效果不是很好,本文讨论了基于非平稳环境下,只有一路带噪语音信号语音增强方法,MMSE 方法事先估计或假设语音频谱地分布,增强效果也较好。该算法不但对非平稳的环境噪声有很好的抑制作用,亦能有效地抑制增
强语音的残留语音噪声。
1MMSE-LSA 语音增强的算法描述
要对准平稳性语音信号做数字处理必须先按短时段对语音信号分帧,这样每一帧信号都具有短时平稳性。带噪语音的短时谱可用快速傅立叶变换一帧一帧的计算得到,在相位提取后存储起来,然后对纯
净语音的短时对数谱作最小均方误差估计。处理后的语音由估计得到的幅度谱和存储的相位重建。我们假设语音频谱分布为高斯分布,推导MMSE-LSA 的估计公式,分析其特性。
根据加性噪声模型,设观察到的一帧带噪信号为=
+
,0≤
,其中
为纯净语音信号,为平稳、加性、高斯
白噪声[1]
。令
个频谱分量。语
收稿日期:2006-10-15E-mail :zp9975@yeah
作者简介:张鹏(1980-),山西侯马人,硕士研究生,研究方向为软件理论、数据库、网络和语音处理;张艳宁,教授,博士生导师,研究方向为模式识别与语音处理、数字图像处理;付中华,博士后,研究方向为模式识别与语音处理;张亚娟,硕士研究生,研究方向为数据库、语音处理。
基于MMSE-LSA 语音增强算法在非平稳
环境下的研究与实现alstom
张
鹏1,张艳宁2,付中华2,张亚娟2
(1.西北工业大学软件学院,陕西西安710065;2.西北工业大学计算机学院,陕西西安710072)
摘
要:讨论了非平稳环境下基于语音短时对数谱的最小均方误差(MMSE-LSA )估计的语音增强算法。众所周知,语音信号为时变信号,在假设语音频谱分布为高斯分布的前提下,实验的工作重点是将MMSE-LSA 算法与其它语音增强算法(以谱相减的语音增强为例)比较。实验结果表明:该MMSE-LSA 算法的语音增强效果很好,特别是在信噪比低时的非平稳环境下效果更为明显。
关键词:语音增强;短时对数谱;最小均方误差;非平稳环境;高斯分布;噪声中图法分类号:TN912.35
文献标识码:A
文章编号:1000-7024(2007)19-4695-03
Study of speech enhancement algorithm bad on MMSE-LSA
under non-stationary environments
ZHANG Peng 1,
ZHANG Yan-ning 2,
FU Zhong-hua 2,
ZHANG Ya-juan 2
(1.College of Software,Northwestern Polytechnical University,Xi'an 710065,China;2.College of Computer Science,Northwestern Polytechnical University,Xi'an 710072,China )
Abstract :The authors studied speech enhancement algorithm bad on MMSE-LSA (minimum mean square error short time log spectral amplitude estimation )under stationary and non-stationary environments.Becau the speech is non-stationary,and supposing the speech spectrum is the distribution of Gaussian,the method of Speech Enhancement algorithm different from the others is discusd.Experiments show that the performance of the algorithm enhances the speech very well,especially in the conditions of low SNR (signal-to-noi ratio )under stationary and non-stationary environments.
Key words :speech enhancement;short-time log-spectral;MMSE (minimum mean square error );non-stationary environments;Gauss distribute;noi
2007年10月计算机工程与设计
Oct.2007
第28卷第19期Vol.28
No.19
Computer Engineering and Design
-4696-
音增强的任务就是利用已知的噪声功率谱信息,
从中估计
影视编辑培训出
,即由
{
1
=
log log
2
}(1
)
¡Ü
}
(3)
基于高斯模型的假设,式(3)
中
即是由
=
{
=
=0
(5)
利用式(4)
计算
,
并由此得到
。
由于
=0
2
,0
from now on2
,
(6)
此处基于高斯模型假设,
为概率密度函数
,
exp
成都教育培训机构{ex
p
=exp{
2
}
(8)
式中:{2
}
,
=
2
yearsold}分别为语音和噪声的第k 个
频谱分量的方差[2],把式(7)和式(8)代人式(6),应用零阶修正贝
赛尔函数
得到
=
exp
2
2
/0
2
2
/
(9
)
+
广州php培训
1
(10
)
定义如下
=
1+
2
=
2
¡ª
¡ª
Ù¤
Âë
文胸英文º¯
Êý
£¬;
;
.
+1
,
2;1;
,在
=2
可导出
2
;1;
1
可由
ln
从式(15)
得到
=
2
1
=0.57721566490是欧拉常数[3]。把式(16)逐
项微分并利用式(15)
有
=0=
=0=
1
1
=
1
2
(18)
把式(18)代人式(5),应用式(12)和式(3),我们得到谱估计
<
1+
2
1+
2
ÒÑÖªµÄÌõ¼þϵõ½µÄ¡£ËùÓõIJÎÊýÊÇÌáÇ°
δ֪µÄ£¬½öÓдøÔëÓïÒô¿ÉÒÔÀûÓá£Òò¶ø£¬ÔÚʵ¼ÊϵͳÖУ¬ÕâЩ²ÎÊýͨ³£ÓɹÀ¼ÆµÃµ½¡£ÏÈÑéÐÅÔë±ÈºÍÈçºÎÅбðÓïÒôÖ¡ÓëÔëÉùÖ¡ÊǹؼüµÄÎÊÌâ¡£ÓÉʽ(20)可以看出,
先验信噪比
,
其中
可以在无语音时通过对噪声的统计求平均获得[7],
对于
,由于语音是时变的,
必须在每一帧重新进行估计。在此,我们使用一种估计方法:最大似然估计方法。此方法就做大致介绍。faithless
下面介绍最大似然估计方法。
假设有
,
,
+1
Ö¡µÄµÚ
Óë
=
+
,
与
均
为高斯分布,求最大似然估计[8],得
到
2总是非负的,所以将上式修正后得
到
1
=max
+
=max ≥0
式中增加了可调参数
≤1,
,它们的值由经
验和主观试听决定。
图1MMSE-LSA 语音增强算法流程
IFFT
premier
窗合并
帧合并
增益函数计算G
语音增强
语音输入y (t )分析窗FFT
||
-4697-
3算法的实现及仿真结果
该算法是利用Matlab 进行仿真的。通过对时域波形的观
察,表明MMSE-LSA 的语音增强算法能够有效地滤除背景噪声,在用了有声/无声判断后,“音乐噪声”也大幅度降低。
图2是对信噪比为5dB 的含噪语音信号进行噪声滤除的结果。图2(a )为原始的纯净语音信号,图2(b )为含噪语音信号,图2(c )为用了MMSE-LSA 增强算法的结果。试验对不同信噪比条件下的含噪语音进行了增强,通过观察语音信号的时域波形,表明基于MMSE-LSA 的增强算法能够有效的去除背景噪声的影响,对比传统的LMS 算法和谱减法,MMSE-LSA 能更有效地改善语音质量,并且随着信噪比的降低,对噪声的抑制效果也越来越明显。
4试验结果分析
实验中采用了采样率为8kHz ,量化位数为16bit ,高斯白
噪声的语音信号,实验中帧长取256点,帧移128点,加窗处理中采用汉明窗。对最小均方误差的语音增强,MMSE-LSA 增强算法和传统的谱相减算法在输入信噪比分别是-10dB 到10dB 时进行了仿真实验,表1给出了MMSE-LSA 的语音增强方法信噪比改善。实验表明,随着信噪比的降低,MMSE-LSA
增强算法对噪声的抑制效果也越来越明显。
从信噪比改善情况可以看出,MMSE-LSA 比MMSE 的增强算法除噪效果要好一些,在输入信噪比为10dB 的高斯白噪声语音信号情况下,MMSE-LSA 比MMSE 的增强算法信噪比提高了0.03dB 以上,随着信噪比的降低,MMSE-LSA 比MMSE 的增强算法输出信噪比都提高了,尤其是在输入信噪比为-10dB 的高斯白噪声语音信号情况下,MMSE-LSA 比MMSE 的增强算法输出信噪比提高了0.05dB ,因此,MMSE-LSA 比MMSE 的增强算法在除噪效果方面要好些。
此外,也可以看出改进的MMSE-LSA 比MMSE-LSA 的增强算法、MMSE 的增强算法、谱减法在除噪效果方面要好。
实验室环境下找10位专业人士进行主观评分,谱减法、MMSE-LSA 和MMSE 的增强算法MOS 平均得分分别为4.3分、4.8分和4.6分,MMSE-LSA 增强算法主观试听效果很好。
5结束语
本文主要研究了基于短时对数谱的语音增强(MMSE-
LSA )算法在非平稳环境中的应用,以及算法中先验信噪比的估计方法和有声和无声帧的判别方法,并将其降噪效果与谱减法进行了对比。实验表明:通过基于短时对数谱估计的最小均方误差的语音增强对同一段带噪语音进行语音增强,和谱减法,维纳滤波算法相比较,无论是客观的除噪效果还是主观试听效果要较好些。与谱减法,MMSE 算法相比,MMSE-LSA 算法的可懂度和自然度也较好。
bankholiday参考文献:
[1]Agawal T,Kabal P.Pre-processing of noisy speech for voice codes [C ].Tsukaba,Japan:Proc IEEE Workshop on Speech Coding,2002:169-171.
[2]Cohen I.Optimal speech enhancement under signal prence un-certainty using log-spectral amplitude estimator [J ].IEEE Signal Processing Letters,2002,9(4):113-116.
[3]Martin R.Noi power spectral density estimation bad on op-timal smoothing and minimum statistics [J ].IEEE Transactions on Speech and Audio Processing,2001,9(5):504-512.
[4]Cohen I,Berdugo B.Speech enhancement for non-stationary noi environments [C ].Signal Processing,2001:2403-2418.[5]
Lallouani A,Gabrea M Gargour C S .Wavelet bad speech en-hancement using two different threshold bad denoising algo-rithms [C ].Canadian Conference on Electrical and Computer En-gineering,2004:315-318.
[6]Painter T,Spanias A.Perceptual coding of digital audio Proc [J ].IEEE,2000,88(4):451-512.
[7]
Jax P.Vary P .Artificial bandwidth extension of speech signals using MMSE estimation bad on a hidden Markov model [C ].IEEE International Conference on Acoustics Speech and Signal Processing,2003:680-683.
[8]You C H,Koh S N,Rahard .Order MMSE spectral amplitude es-timation for speech enhancement [J ].IEEE Transactions on Speech and Audio,2005,13(4):475-486.
图2时域语音波形比较
(b )含噪语音
(c )MMSE-LSA
算法语音
表1
3种算法信噪比改善情况
10
5010
MMSE 22.1816.429.78 5.46 2.02MMSE-LSA
22.21
16.46
9.81
5.49
2.07传统的谱减法
18.8512.108.73 2.76