语音识别数据集及性能评测指标WER

语音识别LibriSpeech ASR corpusLibriSpeech 数据集共将近1000个小时的数据集。分为clean和other两类。具体见链接。WER评价指标WERmeans " word error rate"对于语音识别的预测结果，需要对此结果进行替换删除、插入某些词使之和标注词序列完全相同。修改的总词数比上标注词序列的个数即为WER，此项指标越低越好。具体计算公式...

大章鱼的小学术之心

5905人浏览 · 2019-06-30 17:06:07

大章鱼的小学术之心 · 2019-06-30 17:06:07 发布

语音识别

LibriSpeech ASR corpus

LibriSpeech 数据集
共将近1000个小时的数据集。分为clean和other两类。具体见链接。

WER评价指标

WER means " word error rate"
对于语音识别的预测结果，需要对此结果进行替换删除、插入某些词使之和标注词序列完全相同。修改的总词数比上标注词序列的个数即为WER，此项指标越低越好。具体计算公式如下,其中替换误差加权为1，删除和插入的误差加权为0.5
$在这里插入图片描述$
WER的取值范围是最小是0，最大可以大于1。此外，类似的评价指标还有SER，CER，仅仅是粗细粒度不同，计算方式相同。