讯飞语音实战(1)
讯飞云开放平台,其实早在三月份就注册了一个帐号,这些天看见机器人群的一个群友在做语音,还给我发了一个语音识别放歌曲的视频,我感觉像那么回事,自己兴趣一下就来了,先试试看。可以申请多个服务,也可以是一个,如上图所示。下载的Linux下的SDK有这么几个文件,外加一个README,短小精悍,很对胃口。进到samples里依次编译每个程序,首先source 64bit_make.sh
讯飞云开放平台http://www.xfyun.cn/,其实早在三月份就注册了一个帐号,这些天看见机器人群的一个群友在做语音,还给我发了一个语音识别放歌曲的视频,我感觉像那么回事,自己兴趣一下就来了,先试试看。
可以申请多个服务,也可以是一个,如上图所示。我这里是拿一个服务做例子。建议一开始多开几个服务,后文就是由于开少了出了点问题(包括离线命令字识别,离线语音合成,申请开发云语义,语音唤醒)
下载的Linux下的SDK有这么几个文件,外加一个README,短小精悍,很对胃口。
进到samples里依次编译每个程序,首先source 64bit_make.sh创建环境变量并且借助当前目录下的Makefile编译程序,编译好的程序在bin目录下。
几个缩写词解释《Development Manual_MSP50.pdf》
- asr_sample (Automatic Speech Recognition)语音识别
因为本地有一段电话号码的文本,以后缀abnf结尾,README里称它为(abnf语法样例)打开后有些乱码,我会换到windows下试试。
2. iat_record(iFly Auto Transform)语音转文字,语音听写
它的结果
关键字放在了下图中,录音是说的:中美速控。不知是系统原因还是没有识别到,显出的是乱码。
3. 实时语音转文字
这个跟第二个差不多
用户词表,用来提高识别率
4. tts 文字转语音
5. sch_speak 语音语义技术能够将语音听写业务中的内容进行语义解析
6. sch_text 语音理解,本地文本
搜索了一下14002是服务端脚本错误。使用开放语义需要到开放语义平台勾选语义场景,网址:http://www.xfyun.cn/index.php/services/osp,不勾选可能会报14002错误码
后来网页上开通后就可以了,也不用重新下载SDK,结果如下图所示:
跑完他们的例子,体验了他们的三大主要服务,语音识别、语音转文字、文字转语音,语义理解没跑通
另外使用指令 LD_LIBRARY_PATH=../libs/x64 gdb ./sch_text 可以调用gdb来调试程序
===================2016.11==============================
在《MSC Novice Manual for Linux.pdf》中
也见过将libmsc.so拷贝到/usr/lib下的做法,我上面的做法也只是其中一个,但相对来说稍微繁琐点,每次都需要输入。
更多推荐
所有评论(0)