在ubuntu上利用科大讯飞的SDK实现语音识别-语义识别等功能

首先，参考科大讯飞的官方sdk中的案例，实现和机器的日常对话和控制。具体步骤：　　1. 通过麦克风捕获说话的声音，然后通过在线语音识别获取语音中的字符。　　2. 将获取到的字符上传到科大讯飞的语义识别中，获得返回回来的信息。（json格式)　　3. 将返回的数据通过cjson库进行解析，获取到我们想要的数据。　　4. 将获取到的结果上传到科大讯飞的库中，进行语音合成，获取到合成...

weixin_30810583

525人浏览 · 2017-01-14 16:42:00

weixin_30810583 · 2017-01-14 16:42:00 发布

首先，参考科大讯飞的官方sdk中的案例，实现和机器的日常对话和控制。

具体步骤：

　　1. 通过麦克风捕获说话的声音，然后通过在线语音识别获取语音中的字符。

　　2. 将获取到的字符上传到科大讯飞的语义识别中，获得返回回来的信息。（json格式)

　　3. 将返回的数据通过cjson库进行解析，获取到我们想要的数据。

　　4. 将获取到的结果上传到科大讯飞的库中，进行语音合成，获取到合成的语音数据。

　　5. 通过alsa库输出声音。

具体的代码已经上传到github中。

https://github.com/qq2216691777/xf_voice

转载于:https://www.cnblogs.com/ynxf/p/6285658.html

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

weixin_30810583

@weixin_30810583

已为社区贡献1条内容