单麦降噪经典书籍《Speechenhancement:theoryandpractice》。。。

更新时间:2023-07-23 00:13:33 阅读: 评论:0

单麦降噪经典书籍《Speechenhancement :theoryandpractice 》。。。
⽬录
前⾔儿童学英语字母
第5章 谱减算法
假设噪声为加性噪声,通过从带噪语⾳谱中减去对噪声谱的估计,就可以得到纯净的信号谱。在不存在⽬标信号的期间,可以对噪声谱进⾏估计和更新。做出这⼀假设是基于噪声的平稳性,这样噪声的频谱在每次更新之间不会有很⼤的改变。
5.1 谱减的基本原理
假设为受噪声污染的输⼊信号,其由纯净语⾳信号和加性噪声组成,即
两边同时做傅⾥叶变换
噪声的幅度谱是未知的,但是可以通过⽆语⾳活动时的平均幅度谱的估计来代替;噪声的相位可以由带噪语⾳的相位来代替,这是因为相位不会对语⾳可懂度造成影响,只是可能在⼀定程度上影响语⾳质量。在式中做以上替换,可以得到纯净信号谱的⼀种估计:
增强信号的幅度谱可能是负值,这是因为错误地估计了噪声谱。然⽽,幅度谱不应该是负值,当两个谱相减时,必须确保总是⾮负值。解决办法之⼀就是对差分谱做半波整流这种半波整流的处理只是保证为⾮负的众多⽅法之⼀,也可以使⽤其他⽅法。有些情况下,使⽤功率谱会好于使⽤幅度谱。为了得到带噪语⾳的功率谱,将式中的与它的共轭相乘
y (n )x (n )d (n )y (n )=x (n )+d (n )
(1)
Y (ω)=X (ω)+D (ω)(2)
∣D (ω)∣ϕ(ω)d ϕ(ω)y (2)(ω)=X
^[∣Y (ω)∣−∣(ω)∣]e D ^jϕ(ω)y (3)
(ω)(=X
^∣Y (ω)∣−∣(ω)∣)D ^(ω)X
^∣(ω)∣=X
^{∣Y (ω)∣−∣(ω)∣,D
^0,if ∣Y (ω)∣>∣(ω)∣D ^others (4)swing是什么
∣(ω)∣X
^(2)Y (ω)Y (ω)∗∣Y (ω)∣2=∣X (ω)∣+∣D (ω)∣+X (ω)⋅D (ω)+X (ω)⋅D (ω)
22∗∗=∣X (ω)∣+∣D (ω)∣+2Re X (ω)D (ω)22{∗}
(5)
其中,,并不能直接得到,⽽是通过,和来
近似。通过⽆语⾳段估计得到,表⽰为;如果我们假定具有零均值,并且与纯净信号不相关,则和这两项简化为零,即
互相关的定义
如果对式的两边同时进⾏傅⾥叶变换,我们可以在⾃相关域得到⼀个类似的⽅程
其中,和分别是估计的纯净信号、带噪语⾳信号和估计的噪声信号的⾃相关序列。因此,原则上也可以在⾃相关域进⾏减法操作。
式也可以写成
其中
我们称为增益函数或抑制函数。是实偶函数意味着是以零点成偶对称的,因此是⾮因果的,在时域,相当于⼀个⾮因果的滤波运算。
谱减算法流程图
∣D (ω)∣2X (ω)⋅D (ω)∗X (ω)⋅∗D (ω)E ∣D (ω)∣{2}E X (ω)⋅D (ω){∗}E X (ω)⋅D (ω){∗}E ∣D (ω)∣{2}∣(ω)∣D ^2d (n )x (n )E X (ω)⋅D (ω){∗}E X (ω)⋅D (ω){∗}∣(ω)∣=X
^2∣Y (ω)∣−2∣(ω)∣D ^2(6)
[X (ω)⋅D (ω)]=∗∗X (ω)⋅∗D (ω)
veritasx (t )→F
X (ω)h (−t )∗→F
H (ω)∗R =
τx (t )h (t −
∫−∞+∞
table tting∗τ)dt =x (t )∗h (−t )∗→F
X (ω)⋅H (ω)
∗(6)r (m )=x ^x ^r (m )−yy r (m )d ^d
^(7)
r (m )x ^x ^r (m )yy r (m )d ^d
^(6)∣(ω)∣=X
^2H (ω)∣Y (ω)∣22(8)
brothel
H (ω)=
1−Y (ω)∣∣
2
(ω)∣∣D ^∣
∣2(9)
H (ω)H (ω)h (n )
该⽅法存在问题
式中的交叉项仅在统计意义上为零,即假设拥有⾜够的数据以得到期望值,同时假定信号是平稳的。然⽽,语⾳是⾮平稳的。在⼤多数
应⽤中,语⾳是基于逐帧的形式被处理,并且这些交叉期望值不⼀定为零。
从上图可以看出,与带噪语⾳信号功率谱⽐较,⾄少在低频部分,交叉项并⾮⼩到可以忽略的地步。尽管交叉项或许不应该在整个频谱上都被忽略,但是⼤多数谱减法为了简单起见,都假设这些项为零。
5.2
谱减的⼏何分析
可以在复平⾯以⼏何形式表⽰为两个复数和的和。
5.2.1
带噪信号与纯净信号相位差的上限
(5)Y (ω)X (ω)D (ω)tan (θ−Y θ)=X a +a cos (θ−θ)
X D D X a sin (θ−θ)
D D X (10)
当噪声和纯净信号向量相互正交,即的时候,相位差达到最⼤值
定义为频谱瞬时信噪⽐
信噪⽐越⼤,则带噪相位与纯净相位之差越⼩。这表明,当某频率处具有较⼤的信噪⽐时,⽤带噪信号谱的相位来代替纯净信号谱相位是⽐较可靠的。
听觉实验表明,当所有频段的信噪⽐⼤于约时,我们感觉不到噪声对信号相位的影响。否则,相位失配将可能使⼈感觉到⾳质“粗糙”。
5.2.2 不同的谱减形式及理论局限
令式两侧的实部和虚部分别相等
通过将式和式求平⽅以后相加,得到
若式中,则纯净信号谱和噪声谱是正交的(不相关的)。因此,在信号向量与噪声向量相互正交这⼀条件下,标准的谱减形式(式)是⾮常精确的。同理,基于式,我们可以推断功率谱减形式(式)在同样条件下也是精确的。
通过三⾓关系图,可以推导该⽅程的另外⼀种形式
大学英语四六级官网θ−D θ=X π/2θ=max (θ−Y θ)∣=X θ−θ=π/2D X tan =−1a X a D
tan −1ξ
scrub1(11)
ξ=
a D 2
a X 2
8dB (2)a cos (θ)=Y Y a cos (θ)+X X a cos (θ)D D (12)
a sin (θ)=Y Y a sin (θ)+X X a sin (θ)
成功男士发型>大学生个人简历封面
D D (13)
(12)(13)a =Y 2
a +X 2
a +D 2
高中英语演讲稿范文
2a a cos (θ−X D X θ)
D (14)
a =X −a c ±
D XD a (c −1)+a D 2XD 2Y
2
(15)
c XD =△
cos (θ−X θ)
D (16)
(15)c =XD 0(4)(14)(6)a =X 2
a +Y 2
a +D 2
−2a a cos (θ−Y D Y θ)
D (17)
a =X −a c ±
Y XY a (c −1)+a Y 2XY 2D
2
(18)
c XY =△
cos (θ−X θ)
Y (19)
若式中,并取负号,则有。在⾼信噪⽐和低信噪⽐的时候,带噪信号和纯净信号近似共线,在该条件下,标准的谱减形式(式)是⾮常精确的。
式和式给出的减法形式易于使⽤,并且由于它们没有引⼊信号和噪声之间的统计假设,因⽽考虑了交叉项的影响,这样就⽐式和式更为精确。但是它们也有含糊的地⽅,那就是没有⼀个简单的办法来确定使⽤其中的正号还是负号。
另⼀个障碍就是其依赖于纯净信号的幅度,⼀个可能的解决⽅案是使⽤预先估计的的值,这样的话需要隐含地假设帧与帧之间的幅度谱不会⼤幅改变。
瞬时信噪⽐与信号/噪声相位之间的关系
抑制函数与带噪/纯净信号和噪声信号相位差之间的关系
当,即当信号和噪声统计不相关时,该抑制函数简化为功率谱减法的抑制函数形式(式)。
5.3 谱减法的缺点
早先提到过,噪声谱的错误估计会导致谱减后的频谱存在负值,最简单的解决⽅法是对这些值进⾏半波整流,以保证⾮负的幅度谱。但是这种对负值的⾮线性处理,会导致信号帧频谱的随机频率位置上
出现⼩的、独⽴的峰值,转换到时域以后,这些峰值听起来就像帧与帧之间频率随机变化的多频⾳。这种由半波整流过程引⼊的“噪声”被描述为具有多频⾳⾳质的颤⾳,⼀般被称为“⾳乐噪声”,⾳乐噪声在语⾳的清⾳段更为明显,此时噪声的功率与语⾳的功率很接近。
5.4 谱减法中使⽤过减技术
Boll所使⽤的的减⼩⾳乐噪声的办法是对谱减的负值设定⼀个下限,⽽不是将它们设为0(式)
该⽅法的主要缺点在于它需要使⽤后续帧的增强语⾳谱,因此可能不能满⾜实时应⽤。
(18)c =XY 1a =X a −Y a D (4)(15)(18)(4)(6)a X ξ=△
=a D 2a X 21−c Y X
21−c Y D 2
(20)
h =△
=
a Y a X 1−c XD
21−c Y D
2
(21)
c =XD 0(9)(4)∣(ω)∣=X
^i ⎩⎨⎧∣Y (ω)∣−∣(ω)∣,i D ^(ω),j =i −1,i ,i +1min ∣∣
∣X ^j ∣∣∣if ∣Y (ω)∣−∣(ω)∣>max ∣(ω)∣i D ^D ^others
(22)

本文发布于:2023-07-23 00:13:33,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/1111737.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信号   噪声   相位   负值
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图