返回 登录
0

Java语音程序开发用户指南

1 概述

本文档是开发科大讯飞Java语音程序的用户指南,定义了语音听写、语音识别、语音合成以及语义理解相关接口的使用说明和体系结构,如图1所示。
图片描述

科大讯飞语音功能抢先体验:
http://www.xfyun.cn/default/online_demo

2 预备工作

支持Java平台开发的操作系统为:Windows、Linux。由于Windows系统为开发者广泛使用的,这里将在Windows上的安装环境的搭建步骤简要介绍如下:
step1 搭建开发环境
1) 配置JDK环境,编者采用的版本是jdk1.6.0_20,读者可以从Sun官网http://java.sun.com/javase/downloads/index.jps下载所需的版本;
2) 安装Eclipse Java IDE,编者采用的版本是Ecilpse3.4,读者可以从官网下载。
step2 导入SDK
1) 在Eclipse中建立你的Java工程。
2)将开发工具包中libs目录下的Msc.jar复制到新建工程的libs目录中。
图片描述

3) 在Eclipse中选中工程,通过工具栏Project->Properties->Java Build Path->Libraries->Add JARS或ADD External JARS引入Msc.jar。
图片描述

4)将SDK.\lib目录下库文件拷贝到工程根目录。
图片描述

5)在你需要使用MSC服务的文件中导入相应的类。
例如:import com.iflytek.speech.SpeechRecognizer;
step3 功能添加
1)初始化
图片描述
初始化后,下面将添加功能。

3 语音听写

主要指将连续语音快速识别为文字的过程,能识别通用常见的语句、词汇,不限制说法。
3.1 语音听写
图片描述
图片描述

3.2 音频流听写
图片描述
图片描述

3.3 上传下载用户词表

上传用户词表可以提高词表内词汇的识别率,也可以提高语义的效果,每个用户终端设备对应一个词表,用户词表的格式及构造方法详见《iFlytek MSC Reference Manual》UserWords类。
图片描述
图片描述

4 语音识别

语音识别,即语法识别,主要指基于命令词的识别,识别指定关键词组合的词汇,或者固定说法的短句。语法识别采用ABNF语法格式。具体详解:http://www.xfyun.cn/
图片描述
图片描述

5 语音合成

将文字信息转化为可听的声音信息,让机器像人一样开口说话。具体详解:http://www.xfyun.cn/index.php/services/online_tts
5.1 播放合成
图片描述
图片描述

5.2 无声合成
图片描述

6 语义理解

6.1 语音语义理解
您可以通过后台配置出一套您专属的语义结果,详见http://osp.voicecloud.cn/
图片描述

6.2 文本语义理解

用户通过输入文本获取语义结果,专属语义结果和上述语音的方式相同。
图片描述

7 附录

7.1 识别结果说明
图片描述
图片描述

7.2 个性发音人列表

1)语言为中英文的发音人可以支持中英文的混合朗读。
2)英文发音人只能朗读英文,中文无法朗读。
3)汉语发音人只能朗读中文,遇到英文会以单个字母的方式进行朗读。
图片描述
图片描述
更多问题,请见:

http://www.xfyun.cn/doccenter/java
http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=13040

评论