语音断点检测（短时改进子带谱熵）

端点检测：确定句子的时间起始点和终点，忽略中间少量的非语音帧，用于语音识别。(Speech Endpoint Detection)熵在信息论中是反映信息度量的一个量。某随机事件的随机性越大，即不确定性越高，则熵值也越大，所以携带的信息量亦越大。本次采用谱熵法对语音进行端点检测。......

qq-120

1156人浏览 · 2022-06-19 19:46:03

qq-120 · 2022-06-19 19:46:03 发布

1. 音频分析

1.输出语音的切分时间点信息，时间点用毫秒表示；
2.把语音分割成多个wav文件；

端点检测：确定句子的时间起始点和终点，忽略中间少量的非语音帧，
用于语音识别。(Speech Endpoint Detection)

熵在信息论中是反映信息度量的一个量。某随机事件的随机性越大，
即不确定性越高，则熵值也越大，所以携带的信息量亦越大。
本次作业采用谱熵法对语音进行端点检测。

2. 谱熵法

在这里插入图片描述

3. 预处理

在这里插入图片描述

4. 双门限法端点检测

在这里插入图片描述

5. 实验结果

在这里插入图片描述

处理 PHONE_001.wav 得到的信息
（1）time.csv: 为语音切段信息；
（2）PHONE_001_vad.wav:为语音VAD处理后，语音段合成的wav；
（3）segmentation文件夹: 为语音分段后各小段的语音；
（4）main_VAD.m: 主函数；
（5）vad.m: 为双门限法端点检测函数；
（6）houzhichuli.m：为间歇长度判定函数；
（7）frame2time.m：为帧对于的时间函数；

代码：
VAD
+qq：1095982611; 80% discount

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生