百度架构师手把手带你零基础实践深度学习——21日学习打卡(第二周第一日)
首先声明,不详细讲解代码部分,主要是针对课程的理解及对作业的分析。(要是有代码相关问题可以私信)不把课件里的复制粘贴,只谈自己的理解。
课程链接百度架构师手把手带你零基础实践深度学习
课程二维码在这里插入图片描述
上一篇文章飞桨PaddlePaddle-百度架构师手把手带你零基础实践深度学习——21日学习打卡(第一周直播视频、大作业、总结)
该课程分类专栏深度学习课程——飞桨paddlepaddle
在这里插入图片描述

今天开始第二周的学习,这周的的主讲老师是孙高峰老师(百度资深算法工程师),主讲内容是计算机视觉(主要讲的是卷积神经网络),最开始也是老生常谈,介绍了计算机视觉的应用场景(我觉得主要是让我们对这部分内容感兴趣),紧接着介绍了计算机视觉的发展历程(我这里就只是简略的看了下,大家不要像我一样哦~)。
今天课程的后半部分讲的才是重点(卷积神经网络),孙老师这个讲解由浅入深,配合课件十分直白直观地将卷积神经网络的概念、卷积神经网络所涉及的卷积、池化(还有激活函数、批归一化、Dropout视频里面还没有讲到,应该是明天讲的吧)部分知识讲解出来,配合两个实例,便于我们理解掌握。

作业

在这里插入图片描述
1.计算机视觉的最基本任务是:图像分类、目标检测、图像语义分割、实例分割(===>内容出处

  • Image Classification: 图像分类,用于识别图像中物体的类别(如:bottle、cup、cube)。
  • Object Localization: 目标检测,用于检测图像中每个物体的类别,并准确标出它们的位置。
  • Semantic Segmentation: 图像语义分割,用于标出图像中每个像素点所属的类别,属于同一类别的像素点用一个颜色标识。
  • Instance Segmentation: 实例分割,值得注意的是,(b)中的目标检测任务只需要标注出物体位置,而(d)中的实例分割任务不仅要标注出物体位置,还需要标注出物体的外形轮廓。

2.paddle.fluid.dygraph.nn.Conv2D参数的有:(===>对应API文档

  • num_channels (int) - 输入图像的通道数。
  • num_fliters (int) - 卷积核的个数,和输出特征图通道数相同,相当于上文中的CoutC_{out}C
    out 。
  • filter_size(int|tuple) - 卷积核大小,可以是整数,比如3,表示卷积核的高和宽均为3 ;或者是两个整数的list,例如[3,2],表示卷积核的高为3,宽为2。
  • stride(int|tuple) - 步幅,可以是整数,默认值为1,表示垂直和水平滑动步幅均为1;或者是两个整数的list,例如[3,2],表示垂直滑动步幅为3,水平滑动步幅为2。
  • padding(int|tuple) - 填充大小,可以是整数,比如1,表示竖直和水平边界填充大小均为1;或者是两个整数的list,例如[2,1],表示竖直边界填充大小为2,水平边界填充大小为1。
  • act(str)- 应用于输出上的激活函数,如Tanh、Softmax、Sigmoid,Relu等,默认值为None。

在这里插入图片描述
3.工业产品缺陷检测===>目标检测、图像分割;自动票据识别===>文字识别
4.卷积神经网络的组件:卷积、池化、批归一化、Dropout(===>内容出处

代码

实例代码链接案例1——简单的黑白边界检测;案例2——图像中物体边缘检测

有什么不对或者可以改进的地方欢迎评论,互相交流

在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐