语音识别中的置信度问题

chinabing

5318人浏览 · 2014-03-03 20:03:11

chinabing · 2014-03-03 20:03:11 发布

对于做语音识别的人来说，置信度的概念也许既熟悉又陌生。

何为置信度？

比如说你我对话，你讲了一个句话，但我没听清楚或没听懂，你是希望我随便应付一句还是希望我让你再说一遍。

这就是置信度，在机器没有“听清”或“听懂”的情况下，提升用户重新输入。

可以说，识别引擎中加入置信度模块可以大大提高用户体验水平。

下面，简单结束置信度的度量方法以及常用的置信度技术方案。

1. 置信度的度量

（1） CER

（2）Speech EER

FAR = FRR

错误接收率 = 错误拒绝率

FAR = false accept / IN_Right

FRR = false reject / IN_Error + OOV

（3） DET

（4） ROC

（5） Normalized Cross Entropy(NCE)

2. 置信度技术方案

（1）基于预测特征

使用解码过程中的各种特征信息作为输入，训练一个二分类器，依次来判断识别结果的可信度

（2）基于后验概率

LVCSR的WPP方案

（3）utterance verification

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

chinabing

已为社区贡献2条内容