写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记] | [homework_code]

Transform是什么

在这里插入图片描述

硬train一发(语音识别)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

语音合成

在这里插入图片描述

Seq2seq其它应用(文字->文字)

在这里插入图片描述

其他应用QA

在这里插入图片描述

特制化模型有更好的效果,参考往年教程

在这里插入图片描述

其它应用(文法解析)

在这里插入图片描述
在这里插入图片描述

其它应用(Multi-label Classification,硬做)

在这里插入图片描述

Object Detection(硬做)

在这里插入图片描述

Seq2seq

在这里插入图片描述
在这里插入图片描述

Encoder

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其它Transform架构(更多)

在这里插入图片描述

Decoder

在这里插入图片描述

Autoregressive

在这里插入图片描述

在这里插入图片描述

Masker(不能看后面的资讯)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

输出是多少个呢?(Adding Stop Token)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Non-autoregressive(NAT)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Encoder - Decoder

在这里插入图片描述
在这里插入图片描述

Cross attention(运作过程)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

各式各样的连接方式

在这里插入图片描述

Training

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Tips

Copy mechanism

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Guided Attention

训练的时候也会出现奇奇怪怪的问题(比如短的发财,发没发音,只有财,漏字了)

在这里插入图片描述

解决方法:从左往右限制(也是大坑,留个资料)

在这里插入图片描述

Beam Search(有时有用(确定性答案,语音合成),有时无用(随机性,创造性的任务不行))

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

评估指标(BLEU score)

在这里插入图片描述
在这里插入图片描述

exposure bias(训练的时候都是正确的,但是预测的时候不知道,可能一步错步步错。一个可能的办法:给训练的时候加点错误的资料…这一招叫做:Schedule Sampling)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

讲完了(Encoder-Decoder-它们中间的关系-怎么训练-Tips)

在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐