噪音环境下的语音识别系统的研究
摘 要
语音增强是一个涉及面很广的研究课题, 它不仅涉及信号检测、 波形估计等传统信号处理理论, 而且还与语音特性、 人耳感知特性和噪声特性密切相关。 因此在语音特性、 人耳感知特性及噪声特性的情况下常用语音增强法有: 噪声对消法、谱减法、维纳滤波法、卡尔曼滤波法、 FIR 自适应滤波法、基于神经网络的语音增强、基于听觉感知的语音增强、 基于小波变换的语音增强方法、 自相关法等。本文主要从以下三种算法进行分析: 谱减法是处理宽带噪声较为传统和有效的方法,利用带噪语音的功率谱估值减去噪声的功率谱估值实现语音去噪; 维纳滤波法是在最小均方准则下实现对语音信号估计的一种滤波器。 对于带噪语音信
号 , 确定滤波器的冲击响应 , 使得带噪语音信号经过该滤波器后得到最接近于 “纯净”的语音信号。小波变换法应用小波阈值去噪的方法,分析了常用的软、硬阈
值函数对语音增强的效果; 仿真结果表明小波法效果较明显, 而谱减法易产生“音乐噪声”,Wiener滤波增强后的残留噪声类似于白噪声,而不是音乐噪声。
关键词:语音增强 谱减法 小波阈值去噪 维纳滤波法
Rearch on speech recognition system under noisy
environment
Abstract
Speech enhancement is a broad topic, it not only relates to signal detection, Waveform Estimation and other traditional signal processing theory, but also is cloly related to the speech characteristics, the human ear and the noi characteristics.Therefore, combined with the speech characteristics and the perceptual properties of human ear and the noi characteristics.Therefore, in common with speech speech characteristics, human perceptual characteristics and noi characteristics of the ca enhancement method:Noi cancellation、 Spectral subtraction、Wiener filtering method 、 Calman filter 、与其造句FIR adaptive filtering method、Speech enhancement bad on Neural Network、 Speech enhancement bad on auditory perception、A speech enhancementmethod bas
ed on Wavelet Transform、The autocorrelation method Etc.This article mainly carries on the analysis from the following three algorithms:Spectral subtraction method is traditional and effective broadband noi,U the noisy speech power spectrum estimation subtract the noi power spectrum estimation implementation of speech denoising.Wiener filtering method is a kind of filter the speech signal estimation in the least mean square criterion implementation.For the speech signal with noi,Determine the filter's impul respon,Thenoisy speech signal through the filter to obtain the speech signal is clost to the "pure".Method of wavelet transform using wavelet threshold denoising,Analysis of the commonly ud soft
慧的繁体字
threshold、effect of hard threshold function for speech enhancement;The simulation results show that the wavelet method has obvious effect, and the spectral subtraction method is easy to produce "music noi", Wiener filter enhancement residual noi is similar to white noi, not the music noi.
Keywords:Speech enhancement Spectral subtraction Wavelet threshold denoising Wiener filtering method
第一章 绪论
1.1 引言
随着社会的不断进步和科技的飞速发展,计算机对人们的帮助越来越大,成
为了人们不可缺少的好助手, 但是一直以来人们都是通过键盘、 鼠标等和它进行
通信,这限制了人与计算机之间的交流, 更限制了消费人群。 为了能让多数人甚售房协议
至是残疾人都能使用计算机, 让计算机能听懂人的语言, 理解人们的意图, 人们
开始了对语音识别的研究。
语音识别是语音学与数字信号处理技术相结合的一门交叉学科,它和认知学、心理学、语
言学、计算机科学、模式识别和人工智能等学科都有密切关系。
1.2 语音识别的发展历史和研究现状
1.2.1 渔家傲赏析国外语音识别的发展状况
国外的语音识别是从 1952年贝尔实验室的 Davis 等人研制的特定说话人孤立数字识别系统开始的。
20 世纪 60 年代,日本的很多研究者开发了相关的特殊硬件来进行语音识别 RCA 实验室的 Martin 等人为解决语音信号时间尺度不统一的问题,开发了一系
列的时问归正方法,明显地改善了识别性能。与此同时,苏联的 Vmtsyuk 提出了采用动态规划方法解决两个语音的时闻对准问题,这是动态时间弯折算法
DTW(dymmic time warping) 的基础,也是其连续词识别算法的初级版.
20 世纪 70 年代,人工智能技术走入语音识别的研究中来.人们对语音识别的研究也取得了突破性进展.线性预测编码技术也被扩展应用到语音识别中, DTw 也基本成熟。
20 世纪 80 年代,语音识别研究的一个重要进展,就是识别算法从模式匹配技术转向基于统计模型的技术, 更多地追求从整体统计的角度来建立最佳的语音识别系统。隐马尔可夫模型 (hidden Markov model侯杰昌,删 )技术就是其中一个典型技术。删的研究使大词汇量连续语音识别系统的开发成为可能。
绍兴到宁波20 世纪 90 年代,人工神经网络 (artificial neural network ,ANN) 也被应用到语
音识别的研究中, 并使相应的研究工作在模型的细化、 参数的提取和优化以及系统的自适应技术等方面取得了一些关键性的进展, 此时,语音识别技术进一步成
熟,并走向实用。许多发达国家,如美国、日本、韩国,已经 IBM 、 Microsoft 、Apple、 AT&T 、 Nrr 扶什么携什么等著名公司都为语音识别系统的实用化开发研究投以巨资。
当今,基于 HMM 和 ANN 相结合的方法得到了广泛的重视。而一些模式识别、
机器学习方面的新技术也被应用到语音识别过程中, 如支持向量机 (supportvector machine,SVM) 技术、进化算法 (evolutionary computation)技术等。