关闭
尊敬的极客用户,您好!
感谢您一直关注并使用极客头条,为了给您带来良好的体验效果及性能,极客头条将于2018年04月27日关闭,您可以在 我的博客 中继续使用发布文章功能并看到已经发布成功的文章。
返回 登录
2

不再局限于麦克风阵列,单麦也可免费接入远场语音识别丨语智科技FFASR开发者平台上线

语智科技FFASR远场语音识别开发者平台即日上线
登陆语智科技官网,调用API即可免费接入:www.yuzhix.com

什么是FFASR?

语智科技FFASR(Far-Field Automatic Speech Recognition) 是专门针对于远场语音交互开发的识别引擎,使远场交互不再局限于麦克风阵列,使任意麦克风采集的音频亦可接入云端识别引擎,获得语音识别结果。

图片描述

FFASR与传统ASR有什么区别?

图片描述

FFASR有哪些特点?

图片描述

为什么FFASR拥有领先15%的卓越性能?

在FFASR远场语音识别引擎上实现这一优异的性能表现,是基于语智科技对远场语音识别的技术链条上每个环节有着学术积累和深刻理解,以及在远场降噪、Deep Learning、声学模型、语言模型等多个领域拥有的技术积累和整合能力。

具体来说,由于FFASR远场识别引擎是通过算法进行声学降噪处理,因此对声学降噪需要解决的三个干扰问题——噪声、混响、干涉进行了精确的数学建模,这同时对处理声学降噪的神经网络提出了更高的设计要求。为了能够同时处理前端声学降噪和语音识别,语智科技FFASR算法将CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)进行了深度整合,搭建了更复杂的深度学习网络,并将网络分成很多部分,用以处理不同的任务。而这样的神经网络还需要更适配和先进的训练平台,语智科技独立设计了的训练平台,替代通常使用的Kaldi ASR进行网络结构训练。

哪些人群适合使用FFASR?

1.手机厂商
2.IoT设备厂商
3.想拥有远场语音交互能力又不想/能使用麦克风阵列的人
4.Geeks

即刻接入FFASR远场语音开发者平台,是时候,让远场语音交互真正来临.

评论