语音识别数据集及性能评测指标WER
语音识别LibriSpeech ASR corpusLibriSpeech 数据集共将近1000个小时的数据集。分为clean和other两类。具体见链接。WER评价指标WERmeans " word error rate"对于语音识别的预测结果,需要对此结果进行替换删除、插入某些词使之和标注词序列完全相同。修改的总词数比上标注词序列的个数即为WER,此项指标越低越好。具体计算公式...
·
语音识别
LibriSpeech ASR corpus
LibriSpeech 数据集
共将近1000个小时的数据集。分为clean和other两类。具体见链接。
WER评价指标
WER means " word error rate"
对于语音识别的预测结果,需要对此结果进行替换删除、插入某些词使之和标注词序列完全相同。修改的总词数比上标注词序列的个数即为WER,此项指标越低越好。具体计算公式如下,其中替换误差加权为1,删除和插入的误差加权为0.5
WER的取值范围是最小是0,最大可以大于1。此外,类似的评价指标还有SER,CER,仅仅是粗细粒度不同,计算方式相同。
更多推荐



所有评论(0)