语音识别

LibriSpeech ASR corpus

LibriSpeech 数据集
共将近1000个小时的数据集。分为clean和other两类。具体见链接。

WER评价指标

WER means " word error rate"
对于语音识别的预测结果,需要对此结果进行替换删除、插入某些词使之和标注词序列完全相同。修改的总词数比上标注词序列的个数即为WER,此项指标越低越好。具体计算公式如下,其中替换误差加权为1,删除和插入的误差加权为0.5
在这里插入图片描述
WER的取值范围是最小是0,最大可以大于1。此外,类似的评价指标还有SER,CER,仅仅是粗细粒度不同,计算方式相同。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐