端到端的深度学习（end-to-end deep learning）

明日何其多_

3379人浏览 · 2020-04-15 14:06:28

明日何其多_ · 2020-04-15 14:06:28 发布

端到端的深度学习就是用单个神经网络代替多阶段的处理过程。以语音识别为例，传统方法的步骤是首先提取一些特征，然后应用机器学习算法在音频片段中找到音位，再把这音位提取出来构成独立的词，最后将词串起来构成音频片段的听写文本。而端到端的方法不需要这些步骤，只要把音频作为神经网络的输入，输出就是听写文本。我们不需要知道神经网络是如何拟合数据的，只要得到最后的输出。

端到端深度学习的优点

让数据说话
只要有足够多的数据，我们不需要知道x到y的映射是怎样的，不用引入人类知识，可以充分利用数据本身的信息。
所需人工设计的组件更少，能够简化设计工作流程。

端到端深度学习的缺点

需要大量的数据。比如，如果我们只有3000小时数据去训练语音识别系统，那么传统的流水线方法效果会很好。但当数据集非常庞大时，比如有10,000小时数据或者100,000小时数据，这时端到端方法的优势才能凸显出来。
排除了可能有用的人工设计组件。学习算法有两个主要的知识来源，一个是数据，另一个是人工设计的东西，可能是组件，函数等。所以当我们有大量数据时，人工设计的东西就不太重要了，但是数据量很少时，构造一个精心设计的系统，实际上可以将人类对这个问题的很多认知直接注入到问题里，对算法来说可能会有帮助。

https://www.bilibili.com/video/BV1f4411C7Nx?p=21.

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐