机器同传技术及应用

本文包括4个部分

从机器翻译到机器同传
同传关键问题与解决方案
中英同传产业应用
未来展望
从机器翻译到机器同传
什么是机器同传
为什么要做机器同传
什么是机器同传
在这里插入图片描述

为什么要做机器同传

• 信息传递效率高

• 任务难度大: 15-20分钟需要休息

  • 源语言:监听、记忆、理解、

  • 目标语言:组织、修正、表达

同传关键问题与解决方案

同传架构
机器同传的几个挑战
解决方案
同传系统
在这里插入图片描述
同传关键问题
挑战一、语音识别错误

在这里插入图片描述
难点二、平衡翻译效果和时延
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
同传ASR错误解决方案
NMT容错模型——鲁棒的NMT模型

在这里插入图片描述
同传ASR错误解决方案——文本纠错模型
ASR纠错模型——将语音信息融入预训练

在这里插入图片描述
在这里插入图片描述
同传平衡翻译质量、延时解决方案
可控延时的翻译模型——WaitK

在这里插入图片描述
在这里插入图片描述
自适应同传切分模型——Meaningful Unit
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
中英同传产业应用
中英语音翻译数据集BSTC

在这里插入图片描述
未来展望
数据

鲁棒性

可控性

评估

未来挑战
1.数据缺乏

2.评估方法

3.同传应用场景

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐