端到端的深度学习就是用单个神经网络代替多阶段的处理过程。以语音识别为例,传统方法的步骤是首先提取一些特征,然后应用机器学习算法在音频片段中找到音位,再把这音位提取出来构成独立的词,最后将词串起来构成音频片段的听写文本。而端到端的方法不需要这些步骤,只要把音频作为神经网络的输入,输出就是听写文本。我们不需要知道神经网络是如何拟合数据的,只要得到最后的输出。

端到端深度学习的优点

  1. 让数据说话
    只要有足够多的数据,我们不需要知道x到y的映射是怎样的,不用引入人类知识,可以充分利用数据本身的信息。
  2. 所需人工设计的组件更少,能够简化设计工作流程。

端到端深度学习的缺点

  1. 需要大量的数据。比如,如果我们只有3000小时数据去训练语音识别系统,那么传统的流水线方法效果会很好。但当数据集非常庞大时,比如有10,000小时数据或者100,000小时数据,这时端到端方法的优势才能凸显出来。
  2. 排除了可能有用的人工设计组件。学习算法有两个主要的知识来源,一个是数据,另一个是人工设计的东西,可能是组件,函数等。所以当我们有大量数据时,人工设计的东西就不太重要了,但是数据量很少时,构造一个精心设计的系统,实际上可以将人类对这个问题的很多认知直接注入到问题里,对算法来说可能会有帮助。

https://www.bilibili.com/video/BV1f4411C7Nx?p=21.

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐