语音方向论文阅读

1.Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition摘要模型结构实验结果BABELAishell-1结论利用BERT预训练模型来做语音识别，引入嵌入注意模块将声学信息融入到bert，促进表征学习...

尚歌

861人浏览 · 2021-09-30 16:25:03

尚歌 · 2021-09-30 16:25:03 发布

1.Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition

摘要

模型结构

实验结果

BABEL

Aishell-1

结论

利用BERT预训练模型来做语音识别，引入嵌入注意模块将声学信息融入到bert，促进表征学习

2.SIMPLIFIED SELF-ATTENTION FOR TRANSFORMER-BASED END-TO-END SPEECH RECOGNITION

摘要

模型结构

实验结果

结论

只是简单的Transformer中的全连接层进行替换成DFSMN或者去掉,没有去探究注意力的优化，实验结果也没有表现特别好！！！

3.Improving Streaming Transformer Based ASR Under a Framework of Self-supervised Learning

摘要

模型结构

实验结果

结论

引入了多阶段学习，使用无监督学习以及知识蒸馏，无很大的创新点

4.HEAD-SYNCHRONOUS DECODING FOR TRANSFORMER-BASED STREAMING ASR

摘要

提出头同步的DACS（解码端自适应计算步骤）算法，

算法步骤

实验结果

结论

针对DACS算法提出HS-DACS算法，在流式结果对比上有所提升

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

尚歌

已为社区贡献12条内容