序列模型基础学习

序列模型简介常见有很多序列问题，如语音识别，金融上的，机器翻译，情感识别，计算机视觉，自然与然处理NLP等等很多。其中自然语言处理的输入输出基本上都是序列，序列问题是自然语言处理最本质的问题。1. 序列模型类型序列模型：就是输入输出均为序列数据的模型，序列模型将输入序列数据转换为目标序列数据。一对多，多对一，部分多对多，完全多对多1.经典的seq2seq模型seq2seq是序列问题中一个非常重要的

BarbaraChow

638人浏览 · 2020-12-17 10:59:00

BarbaraChow · 2020-12-17 10:59:00 发布

序列模型简介

常见有很多序列问题，如语音识别，金融上的，机器翻译，情感识别，计算机视觉，自然与然处理NLP等等很多。其中自然语言处理的输入输出基本上都是序列，序列问题是自然语言处理最本质的问题。

1. 序列模型类型

序列模型：就是输入输出均为序列数据的模型，序列模型将输入序列数据转换为目标序列数据。
一对多，多对一，部分多对多，完全多对多
在这里插入图片描述
在片描述

1. 经典的seq2seq模型

seq2seq是序列问题中一个非常重要的模型，很多的序列问题都可以用seq2seq来解决，比如说机器翻译、语音转文字、图像标注、文本总结等等。seq2seq基本框架还适用于图像压缩，超分辨率等计算机视觉的问题。

该模型就是多对多类型的（编码-解码模型）
在这里插入图片描述
通过encoder对源语言（输入）进行编码得到fixed length的上下文向量（content vector）c，然后在从c恢复出要翻译的目标语言（输出）。
基于CNN的seq2seq:

基于LSTM：

RNN优点：

Model of choice for learning variable-length representations（可处理变长句子）
Natural fit for sentences of pixels（可按单词为单位进行处理）

RNN缺点：

Sequential computationsinhibits parallelization（无法并行计算）
No explicit modeling of long and short range dependencies（对于长短期的记忆没有明显的表征建模，我理解应该是有定性无定量的意思吧）
We want to model hierarchy（我理解：模型不是层次的，而是摊开的）
Transmitting local and global information through one bottleneck[hidden state]（所有的输入信息都是压缩在了上下文向量c中）

CNN优点：

Trivial to parallelize(per layer)（非常适合并行化处理）
Exploits local dependencies（很好的捕捉到局部依赖，我理解：卷积操作就是一个个step挪动的，每个细节都会cover到）
interaction distance’between positions linear or logarithmic Long-distance dependencies require many layers（例如下图中的例子，每个卷积只会捕捉到3个词的信息，如果词相隔较远，则需要在后面的conv层才能捕捉到它们的相关信息）

常见的基于CNN的机器翻译模型：
在这里插入图片描述

2.注意力机制Attention

带有注意力的循环神经网络 RNNs With Attention
Removes bottleneck of Encoder-Decoder Model
Provides context for given decoder step
在这里插入图片描述

在这里插入图片描述

总结：

如何实现并行计算同时缩短依赖距离：采用自注意力机制
如何像CNN一样考虑到多通道信息：采用多头注意力
自注意力机制损失了位置信息，如何补偿：位置嵌入
后面的层中位置信息消散：残差连接

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生