基于Tensorflow的VCTK语音识别例子测试

语音识别是深度学习早先攻克的几个领域之一。传统的基于HMM等的语音识别精度一直比较受限。但是深度学习还是给语音识别的精度带来了一个飞跃性的提高。本文在网上找了段代码实现了下，感觉非常简单就可以复现。不过看了过程，也非常简单，主要有几步：（1）　下载VCTK数据集；（2）　对数据集，提取每个WAV文件的MFCC特征以及对应的语音文本标注语料。（3）　设置CTC的损失目

sparkexpert

6411人浏览 · 2017-05-04 15:12:44

sparkexpert · 2017-05-04 15:12:44 发布

语音识别是深度学习早先攻克的几个领域之一。传统的基于HMM等的语音识别精度一直比较受限。但是深度学习还是给语音识别的精度带来了一个飞跃性的提高。本文在网上找了段代码实现了下，感觉非常简单就可以复现。

不过看了过程，也非常简单，主要有几步：

（1）　下载VCTK数据集；

（2）　对数据集，提取每个WAV文件的MFCC特征以及对应的语音文本标注语料。

（3）　设置CTC的损失目标函数。

（4）　进行训练。

这样训练完保存模型，则可以开始进行训练。

训练效果如图所示：

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

玩转 AIGC 工具，早点下班！

CSDN学习社区

cover

用 OpenAI Assistants 做大模型应用开发

CSDN学习社区

cover

1 小时解读鸿蒙 10 大热点问题

CSDN学习社区

所有评论(0)

查看更多评论

sparkexpert

已为社区贡献12条内容