讯飞语音实战（1）

yaked19

3869人浏览 · 2016-09-12 23:15:44

yaked19 · 2016-09-12 23:15:44 发布

讯飞云开放平台http://www.xfyun.cn/，其实早在三月份就注册了一个帐号，这些天看见机器人群的一个群友在做语音，还给我发了一个语音识别放歌曲的视频，我感觉像那么回事，自己兴趣一下就来了，先试试看。

可以申请多个服务，也可以是一个，如上图所示。我这里是拿一个服务做例子。建议一开始多开几个服务，后文就是由于开少了出了点问题（包括离线命令字识别，离线语音合成，申请开发云语义，语音唤醒）

下载的Linux下的SDK有这么几个文件，外加一个README，短小精悍，很对胃口。

进到samples里依次编译每个程序，首先source 64bit_make.sh创建环境变量并且借助当前目录下的Makefile编译程序，编译好的程序在bin目录下。

几个缩写词解释《Development Manual_MSP50.pdf》

asr_sample （Automatic Speech Recognition）语音识别

注意这里运行程序的时候要先指定库目录的位置哦，即LD_LIBRARY_PATH=...这句，是在用BeagleBone的时候学到的，有些东西是互通的。

因为本地有一段电话号码的文本，以后缀abnf结尾，README里称它为（abnf语法样例）打开后有些乱码，我会换到windows下试试。

2. iat_record(iFly Auto Transform)语音转文字，语音听写

它的结果

关键字放在了下图中，录音是说的：中美速控。不知是系统原因还是没有识别到，显出的是乱码。

3. 实时语音转文字

这个跟第二个差不多

用户词表，用来提高识别率

4. tts 文字转语音

5. sch_speak 语音语义技术能够将语音听写业务中的内容进行语义解析

6. sch_text 语音理解，本地文本

搜索了一下14002是服务端脚本错误。使用开放语义需要到开放语义平台勾选语义场景，网址：http://www.xfyun.cn/index.php/services/osp，不勾选可能会报14002错误码

后来网页上开通后就可以了，也不用重新下载SDK，结果如下图所示：

跑完他们的例子，体验了他们的三大主要服务，语音识别、语音转文字、文字转语音，语义理解没跑通

另外使用指令 LD_LIBRARY_PATH=../libs/x64 gdb ./sch_text 可以调用gdb来调试程序

===================2016.11==============================

在《MSC Novice Manual for Linux.pdf》中

也见过将libmsc.so拷贝到/usr/lib下的做法，我上面的做法也只是其中一个，但相对来说稍微繁琐点，每次都需要输入。

Save

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

yaked19

已为社区贡献3条内容