kaldi中文语音识别平台的搭建——运行thchs30
kaldi资料的准备:《Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)》运行kaldi中的自带样例:《Kaldi学习笔记(四)——thchs30中文在线识别》thchs30的主要搭建过程参照以上两篇博客,此处就不再赘述。但是在搭建的过程中可能会出现一些问题,由于kaldi目前网上的资料比较少,很多问题搜不到,都是自己一个坑一个坑地填过来的,因此打算在这里记录一下,提示...
·
kaldi资料的准备:《Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)》
运行kaldi中的自带样例:《Kaldi学习笔记(四)——thchs30中文在线识别》
thchs30的主要搭建过程参照以上两篇博客,此处就不再赘述。但是在搭建的过程中可能会出现一些问题,由于kaldi目前网上的资料比较少,很多问题搜不到,都是自己一个坑一个坑地填过来的,因此打算在这里记录一下,提示后来人。
1、跑完训练数据后,tri1中没有出现HCLG.fst和words.txt这两个文件
原因:很可能是内存不够,我之前用的8G内存,跑完也没出来。后来给了10G,才跑出来。如果用虚拟机跑的话,跑的过程中建议不要做其他事,可以放在半夜跑。
2、采样率不支持的问题,报错信息如下
Sampling rates other than 16kHz are not supported
建议:下载格式工厂,把音频的采样率转化为16K
3、tri1非常不准确,有条件的还是要用个服务器跑下dnn
我的音频文件是“需要的,不需要,需要的,不需要”。但是识别出来是下面这个样子。。。我自己都懵逼了。
更多推荐
已为社区贡献1条内容
所有评论(0)