相信大家都对语音灰常感兴趣了。

这两天看了些语音方面的资料,感觉语音确实还有很长的路要走(尤其是中文):


语音:顾名思义就是我们平时说的自然语言。

当然,语音识别我个人把它分成三块:

1:将一些文本等等的内容转换成语音输出。

我写了一个小小的播报短信的demo,很简单,但是它只能像机器人一样的一个字一个字的去读,可能有一些企业做过优化,但俺现在实在是没有这方面能力,只能使用现成的api了,这里我使用的是 一款叫做手说的应用的服务。 有兴趣的朋友可以看看研究研究。它主要是基于微软的tts的接口做的。

2:将我们说的话转化成机器能识别的语言。

这里我只是实现了一个最简单的demo,那就是基于讯飞提供的接口去做的,把我们说的话转换成文字。我们做开发的都知道,只要能把语言转换成了文字,那我们可以做的事情就多了,所有逻辑只要是对这些文字进行字符串的处理,和必要的逻辑业务处理就ok了。

3:人机对话,这个我觉得是最最智能的一个东东了。

首先这类的应用都很受欢迎,像人人网上有一个小黄鸡,当然它还没有实现人和机器的语音对话,已经是非常受欢迎的了。目前有一些开放的服务器,他们提供这种对话,但是支持中文的貌似很少,我只找到了一家,还是只支持汉语拼音,真是汗呐。中国既然已经有了像小黄鸡这样比较成熟的产品,为什么就没有人开放出来供广大开发者使用一下呢,可能这就是中国和国外的差距吧。


android语音一般也就是基于以上者三个,我写了几个demo,有兴趣的可以留言,我会发给你们,并告诉你们使用方法,如果有时间,我后面会把代码以及说明一起放上来,不过现在吃饭时间了,我该去干点正经事了。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐