微信小程序语音识别代码

通过微信小程序wx.startRecord()和wx.stopRecord()接口录音并上传silk录音文件至服务器，通过ffmpeg将silk录音文件转成wav录音文件，再通过百度语音识别。代码实现录音和语音文件上传node服务端接收语音文件代码silk文件转wav文件我使用的是silk-v3-decoder将silk文件转wav文件silk-v3-decoder使用方法百度语音识别RESTAP

厦门在乎科技

405人浏览 · 2021-05-25 15:45:36

厦门在乎科技 · 2021-05-25 15:45:36 发布

通过微信小程序wx.startRecord()和wx.stopRecord()接口录音并上传silk录音文件至服务器，通过ffmpeg将silk录音文件转成wav录音文件，再通过百度语音识别。
在这里插入图片描述
代码实现

录音和语音文件上传

node服务端接收语音文件代码

silk文件转wav文件

我使用的是silk-v3-decoder将silk文件转wav文件

silk-v3-decoder使用方法

百度语音识别RESTAPI识别wav文件

1、通过APIKey和SecretKey获取的access_token

通过APIKey和SecretKey获取的access_token文档

2、通过token调用百度语音识别RESTAPI识别接口

3、语音识别优化

通过上述操作后，发现识别的内容和实际内容差别很大

百度语音识别RESTAPI文档

查看文档可知：采样率：8000/16000仅支持单通道

在ffmpeg里对应的设置方式分别是：

-arrate设置采样率

-acchannels设置声道数

修改converter.sh文件，修改为下图所示

修改后的converter.sh文件

如果你也想开发一款属于自己的微信小程序，可以通过第三方专业开发平台，来帮助你实现开发需求：厦门在乎科技-专注小程序、app、网站开发

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

厦门在乎科技

@weixin_41996102

已为社区贡献1条内容