常用语音数据库

大多数语音识别数据集是专有的，因为这些数据对于创建该数据集的公司来说具有很大价值。因此，这部分的可用公开数据集多数比较陈旧。【学术、陈旧】2000 HUB5 English：仅包含英语的语音数据集，百度最近的论文《深度语音：扩展端对端语音识别》使用的是这个数据集。地址：https://catalog.ldc.upenn.edu/LDC2002T43 【学术】LibriSpeech...

Digital-Twin

10450人浏览 · 2018-07-25 11:42:02

Digital-Twin · 2018-07-25 11:42:02 发布

大多数语音识别数据集是专有的，因为这些数据对于创建该数据集的公司来说具有很大价值。因此，这部分的可用公开数据集多数比较陈旧。

【学术、陈旧】2000 HUB5 English：仅包含英语的语音数据集，百度最近的论文《深度语音：扩展端对端语音识别》使用的是这个数据集。

地址：https://catalog.ldc.upenn.edu/LDC2002T43

【学术】LibriSpeech：包含文本和语音的有声读物数据集，由近500小时的多人朗读的清晰音频组成，且包含书籍的章节结构。

地址：http://www.openslr.org/12/

【有用、学术】VoxForge：带口音的语音清洁数据集，对测试模型在不同重音或语调下的鲁棒性非常有用。

地址：http://www.voxforge.org/

【学术、经典、陈旧】TIMIT：英文语音识别数据集。

地址：https://catalog.ldc.upenn.edu/LDC93S1

【有用】CHIME：包含环境噪音的语音识别挑战赛数据集。该数据集包含真实、模拟和清洁的语音录音，具体来说，包括4个扬声器在4个有噪音环境下进行的将近9000次录音，模拟数据是将多个环境组合及在无噪音环境下记录的数据。

地址：http://spandh.dcs.shef.ac.uk/chime_challenge/data.html

TED-LIUM：TED Talk 的音频数据集，包含1495个TED演讲的录音及全文的文字稿。

地址：http://www-lium.univ-lemans.fr/en/content/ted-lium-corpus

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

Digital-Twin

已为社区贡献4条内容