随着近几年AI技术发展,自2016年callcenter技术便开始结合语音识别ASR,语义理解NLU,语音合成TTS,进行开发预设型AI语音机器人,我们是2017年4月发布第一版,由于当时市场接受能力差,没有非常好的使用场景我们并没有大力推广,只是小范围应用和企业定制化开发了一些场景。
磐石云AI机器人
由于
近三年来口罩导致很多企业不得不采用AI技术,包括openai的chatgpt也是在这期间诞生的,我们是2020年开始收到相关部门需求,需要使用语音机器人通知做核酸检测,流调等场景,发现我们17年的产品又可以拿出来改造一下做点简单的场景了。做些很多不错的案例之后发现主流的ASR引擎包括头部的几家并不能完全满足识别准确率的要求,于是我们开始了自己的ASR、TTS研发之路,经过近三年的打磨效果逐渐接近预期效果,在8K电话客服场景下可以与其他厂商切磋切磋。
在这里分享下几点技术要点;
1、要有不错的ASR引擎进行支持语音转写服务,语音识别都不准的话,其他都是白费。
2、ASR的VAD降噪技术要做到主动降噪,识别被叫就行了,周边的杂音以及其他人说话不需要的都切掉。
3、媒体sip服务器采集音频时进行VAD切除无用杂音,这个没有最好只有更好,需要长期持续不断的训练,在并发性能和降噪性能上我们训练了很久。
4、AI话术逻辑知识库丰富才能更精准回答用户问题。
5、灵敏度、打断算法、业务逻辑这些都是必然的,不过也是机器人技术中最容易的。
下图是我们2023年5月发布的一个版本,集群支持了无限并发,中继组,意向推送等
磐石云AI

以上就是机器人主要的技术要点,如有表达不准确欢迎指正。
如今应用在能源、通信、医疗、教育、金融、政务、物流、电商等行业。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐