最近突然对语音识别有了点兴趣,于是开始了语音识别的兴趣学习之旅,在众多语音识别工具中我选择了Kaldi作为我的语音识别工具,首先介绍一下Kaldi这款语音识别工具的创始人是全球AI之父Daniel Povey,在小米2019 AIOT 开发者大会上听过Daniel Povey介绍过这款语音识别工具,我觉得比较符合我对语音识别工具的要求,当然这款语音识别工具吸引了很多国内外的语音识别开发者去研究去探索语音识别带来的乐趣。

在初次安装前我去Google了一下Kaldi官方文档,看了一下官方的教程(使用Google翻译了一下)发现转换回来的文字读不懂,有语病,将就着看了一下,前前后后折腾了两天,总结了一套安装教程如下:
打开Linux终端等待运行完毕后输入:

git clone --recursive https://github.com/kaldi-asr/kaldi

等待片刻,Kaldi就从GitHub上下载下来了。当然,首先得确保你安装了Git。如果你没有进行安装的话,就去输入:

sudo apt-get install git

然后输入"cd"(小写)回车!随后输入"ls"(小写)回车!即可查看到根目录下的所有文件,其中你会看到:“kaldi-trunk” 此时就代表着Kaldi已经成功下载!

随后在输入"cd kaldi-trunk"(小写)打开"kaldi-trunk"这层目录,在这个目录中你会看到很多的文件,其中:"tools、src、egs"这三个目录是最重要的!

随后再次输入"cd tools"(小写)打开"kaldi-trunk"目录底下的tools目录,这个tools目录里面全部都是Kaldi的依赖包!

在"src"这个目录里面存放的是Kaldi的源代码。

在"egs"这个目录里面存放的是Kaldi提供的一些例子。我们现在要做的就是编译安装Kaldi依赖的各种库,然后再去编译安装Kaldi。

在编译"Kaldi"之前,首先需要确保你安装了如下一堆软件:
apt-get
subversion
automake
autoconf
libtool
g++
zlib
libatal
wget
如果都没有安装的话,建议你通过如下一堆命令,依次进行安装:
sudo apt-get install subversion

sudo apt-get install automake

sudo apt-get install autoconf

sudo apt-get install libtool

sudo apt-get install g++

sudo apt-get install wget

sudo apt-get install libatlas-dev

sudo apt-get install libatlas-base-dev

sudo apt-get install zlib1g

sudo apt-get install zlib1g-dev

安装完成后,转到"tools"目录下,然后输入"make -j 4"命令加快编译的速度!

之后使用命令切换到"src"目录下,输入"./configure"进行配置!然后再输入"make -j 4"。经过漫长的编译过程后,Kaldi就顺利安装完成了!

此刻开始尽情享用"Kaldi"吧!
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐