统计法实施条例硕士学位论文
题目: 基于声门信息的说话人确认方法研究
研究生骆启帆
专业信号与信息处理
指导教师章坚武教授
完成日期2014年4月
杭州电子科技大学硕士学位论文历史书籍
人在北京基于声门信息的说话人确认方法研究
研究生:骆启帆
指导教师:章坚武教授
2014年4月
Disrtation Submitted to Hangzhou Dianzi University
for the Degree of Master
Speaker Verification Bad On The Glottis
Information
Candidate: Luo Qifan
Supervisor: Prof. Zhang Jianwu
April,2014
杭州电子科技大学
学位论文原创性声明和使用授权说明
原创性声明
本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
论文作者签名:日期:年月日
学位论文使用授权说明
本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)
论文作者签名:日期:年月日
指导教师签名:日期:年月日
杭州电子科技大学硕士学位论文
摘要
甲字形墓语音是人类最自然最重要的交流沟通方式,将语音信号中说话人的信息提取出来,即说话人识别,也称为声纹识别,是目前语音信号处理中的一个重要研究方向。随着智能计算、网络安全需求的迅速发展,可提供生物特征识别的声纹识别技术受到越来越多的关注,正在走向实用化。
经过多年的研究,实验室环境下的说话人识别系统已经较为成熟。然而,从实验室走向现实环境仍有一定的问题。问题主要集中在说话人识别的鲁棒性与计算量上。说话人识别系统可以粗略的分为特征提取与模式识别两部分。在经典的文本无关说话人识别技术中主要采用梅尔倒谱系数与UBM-MAP-GMM模型作为特征提取与模式识别。UBM-MAP-GMM模型尽管考虑了测试语音与训练语音失配的问题,但在实际情况下,该模型的运算量与存储需求仍较大,鲁棒性离实用还有一些距离。本文从研究语音信号中不同类型的信息如何混杂、如何提取入手,引入语音高层信号分析,对增强声纹识别鲁棒性、减少计算量进行了研究。
本论文的主要研究内容如下:
1.探讨了高斯混合模型的物理意义,并介绍了当前的一些对UBM-MAP-GMM模型的改进方法,
分析了当训练语音中部分音素类较少时经典模型的处理方式及其不足,进而提出了基于挑选高斯分量的说话人确认系统。实验证明,改进的说话人确认系统无论是训练时间,还是等错误率,均有一定的下降。农民工维权
2.短时特征参数MFCC反映的是说话人的声道特征,基于基频与帧能量的韵律特征反映的是
说话人的声门信息,两者从不同的角度刻画了说话人,存在互补以提高系统性能的能力。
微生物发酵
本文提出了基于二次判决的特征融合方法,实验表明,在该方法下系统性能有一定的提高。炸虾的做法大全
3.基于能量的声门信息与短时特征参数MFCC均带有说话人个性信息,然而由于两者描述的
是不同层次的个性特征,因此必然存在相互干扰。本文通过从短时特征参数MFCC中剥离声门信息,使得短时特征参数MFCC的区分能力得到提升,从而改善了说话人识别系统的性能。
关键字:挑选高斯分量;韵律特征;二次判决;声门信息
出入的意思I