摘要:

语音信号的基音周期是描述激励源的重要特征参数之一,准确的检测语音信号的基音周期对高质量的语音分析与合成,语音压缩编码,语音识别等都具有重要意义.本文讨论了几种常用的基音周期检测方法以及小波变换和Hilbert-Huang变换,提出了抗噪性很好的自相关能量函数和幅度差能量函数相结合的基音周期检测算法,并将Hilbert-Huang变换应用于TD-PSOLA语音合成系统的基音标记中. 文中首先介绍了几种常见的语音基音周期检测方法如自相关函数法(ACF),平均幅度差法(AMDF),倒谱法.自相关函数方法适合于噪声环境下,但单独使用经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况;平均幅度差法,倒谱法在静音环境下或噪声较小时可以取得较好的检测结果,但在语音环境较恶劣,信噪比较低时,检测的结果下降较快,难以让人满意.基于此,本文提出了一种抗噪性很好的自相关能量函数(ACEF)和幅度差能量函数(MDEF)相结合的基音周期检测算法,抑制了自相关函数不必要的峰值,提高了抗噪性,有效弥补了传统基音周期检测算法的缺点. 论文介绍了小波变换理论,包括连续小波变换,离散小波变换,多分辨率分析,Mallat算法等,并通过实验分析了基于Mallat算法的基音周期检测方法—小波分解与重构算法(高频置零)以及在Mallat算法基础上衍生出的多孔算法.直接用Mallat算法分解语音信号时,需要降采样,每一级分解后的分量长度是上一级分解分量长度的一半;而采用多孔算法时是直接对滤波器系数插值,每一级分解后的分量长度都与原信号的长度相等,有利于基音周期的提取. 论文介绍了Hilbert—Huang变换理论,并将它应用于基音周期检测中.与传统方法相比,Hilbert-Huang变换不需要对语音信号进行短时平稳假设,检测精度高,适应范围广,帧长大大增加;与小波变换相比,Hilbert—Huang变换依据信号本身的信息对信号进行分解,随信号本身变化而变化,表现了信号内含的真实物理信息,具有更好的自适应性和优越性. 论文将Hilbert—Huang变换应用于TD-PSOLA语音合成系统基音标注中,大大拓展了Hilbert-Huang变换的应用范围,并以实验证明:通常使用的自相关方法只求得每帧语音信号的平均基音周期,然后对所求得的基音周期在帧内采用插值技术标注,准确性不高;而用Hilbert-Huang变换方法给语音信号做基音标注,基本检测出了一段语音信号的所有基音峰值点,体现出每帧内微小的周期变化,比通常使用的自相关方法准确性高.

展开

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐