讯飞云开放平台http://www.xfyun.cn/,其实早在三月份就注册了一个帐号,这些天看见机器人群的一个群友在做语音,还给我发了一个语音识别放歌曲的视频,我感觉像那么回事,自己兴趣一下就来了,先试试看。


可以申请多个服务,也可以是一个,如上图所示。我这里是拿一个服务做例子。建议一开始多开几个服务,后文就是由于开少了出了点问题(包括离线命令字识别,离线语音合成,申请开发云语义,语音唤醒)

下载的Linux下的SDK有这么几个文件,外加一个README,短小精悍,很对胃口。

进到samples里依次编译每个程序,首先source 64bit_make.sh创建环境变量并且借助当前目录下的Makefile编译程序,编译好的程序在bin目录下。

几个缩写词解释《Development Manual_MSP50.pdf》


  1. asr_sample (Automatic Speech Recognition)语音识别
注意这里运行程序的时候要先指定库目录的位置哦,即LD_LIBRARY_PATH=...这句,是在用BeagleBone的时候学到的,有些东西是互通的。

因为本地有一段电话号码的文本,以后缀abnf结尾,README里称它为(abnf语法样例)打开后有些乱码,我会换到windows下试试。


2. iat_record(iFly Auto Transform)语音转文字,语音听写

它的结果

关键字放在了下图中,录音是说的:中美速控。不知是系统原因还是没有识别到,显出的是乱码。

3. 实时语音转文字

这个跟第二个差不多

用户词表,用来提高识别率

4. tts 文字转语音


5. sch_speak 语音语义技术能够将语音听写业务中的内容进行语义解析

6. sch_text 语音理解,本地文本

搜索了一下14002是服务端脚本错误。使用开放语义需要到开放语义平台勾选语义场景,网址:http://www.xfyun.cn/index.php/services/osp,不勾选可能会报14002错误码

后来网页上开通后就可以了,也不用重新下载SDK,结果如下图所示:


跑完他们的例子,体验了他们的三大主要服务,语音识别语音转文字文字转语音,语义理解没跑通

另外使用指令 LD_LIBRARY_PATH=../libs/x64 gdb ./sch_text 可以调用gdb来调试程序



===================2016.11==============================

在《MSC Novice Manual for Linux.pdf》中

也见过将libmsc.so拷贝到/usr/lib下的做法,我上面的做法也只是其中一个,但相对来说稍微繁琐点,每次都需要输入。

Save
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐