kaldi资料的准备:《Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)》

运行kaldi中的自带样例:《Kaldi学习笔记(四)——thchs30中文在线识别》

thchs30的主要搭建过程参照以上两篇博客,此处就不再赘述。但是在搭建的过程中可能会出现一些问题,由于kaldi目前网上的资料比较少,很多问题搜不到,都是自己一个坑一个坑地填过来的,因此打算在这里记录一下,提示后来人。

1、跑完训练数据后,tri1中没有出现HCLG.fst和words.txt这两个文件

原因:很可能是内存不够,我之前用的8G内存,跑完也没出来。后来给了10G,才跑出来。如果用虚拟机跑的话,跑的过程中建议不要做其他事,可以放在半夜跑。

2、采样率不支持的问题,报错信息如下

Sampling rates other than 16kHz are not supported

建议:下载格式工厂,把音频的采样率转化为16K

3、tri1非常不准确,有条件的还是要用个服务器跑下dnn

我的音频文件是“需要的,不需要,需要的,不需要”。但是识别出来是下面这个样子。。。我自己都懵逼了。

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐