计算机视觉-深度学习与传统神经网络的区别

与传统神经网络的区别区别神经网络深度学习网络架构3层以内可达上千层层间连接通常全连接形式多样:共享权值、跨层的反馈目标函数MSE(mean square error)CE(cross entropy)激活函数SigmoidReLU梯度下降方法GDAdam避免过适应凭经验Dropout目标函数Softmax层...

Gin_Tan

2373人浏览 · 2020-02-05 20:20:24

Gin_Tan · 2020-02-05 20:20:24 发布

与传统神经网络的区别

区别	神经网络	深度学习
网络架构	3层以内	可达上千层
层间连接	通常全连接	形式多样:共享权值、跨层的反馈
目标函数	MSE(mean square error)	CE(cross entropy)
激活函数	Sigmoid	ReLU
梯度下降方法	GD	Adam
避免过适应	凭经验	Dropout

目标函数

在这里插入图片描述

Softmax层

Softmax层的作用是突出 “最大值”并转换成概率的形式
在这里插入图片描述

激活函数

梯度消失的直观解释

在这里插入图片描述

ReLU

在这里插入图片描述

梯度算法

SGD 随机梯度下降

学习率不易确定，太小过慢，太大震荡
每个参数的学习率固定，希望对出现频率低的特征进行大一点的更新
学习过程容易陷入马鞍面，此区域所有方向的梯度值几乎为0

后面陆续有 Momentum、Nesterov Momentum、Adagrad、RMSprop、Adam(adaptive moment estimation，自适应矩估计)
在这里插入图片描述

梯度算法比较

在这里插入图片描述

避免过适应

产生原因

权重参数太多，而样本量不足

避免

早期停止训练
权重衰减
Dropout

早期停止训练

在这里插入图片描述

权重衰减

在这里插入图片描述

Dropout

在这里插入图片描述

CNN 初步介绍

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

Kaldi之父，IEEE Fellow，小米首席语音科学家Daniel Povey将出席2024全球机器学习技术大会并发表演讲！

CSDN学习社区

cover

探索神经网络在商品销售和图像识别中的应用

CSDN学习社区

cover

基于stm32F103的座面声控台灯

CSDN学习社区

所有评论(0)

查看更多评论

Gin_Tan

已为社区贡献3条内容