中国工信出版集团、人民邮电出版社出版的赵卫东、董亮编著的《机器学习》慕课版

第12章 高级深度学习

1.目标检测与追踪中的运动目标如何合理地表示?

解:目标检测和追踪需要注意运动目标的表示,例如对其视觉特征进行建模,并采用相似性度量来对帧图像进行匹配,在追踪过程中需要处理大量冗余信息,采用搜索算法缩小比较范围。为了合理地表示运动目标,首先要获取目标的初始状态并且提取目标的特征,在此基础上构建目标描述模型,模型可分为生成式模型和判别式模型。生产式方法运用生成模型描述目标的表现特征,之后通过搜索候选目标来最小化重构误差。判别式方法通过训练分类器来区分目标和背景。

2.目标检测与追踪的深度学习框架有哪些?

解:R-CNN(Regions with CNN features)、FASt-RCNN、Faster RCNN等。

3.举例说明R-CNN的应用。

解:R-CNN可以用于目标检测、图像识别、检索和分类。R-CNN可以应用在车辆目标检测,食品图像检索和分类,手势识别,植物关键器官识别,人体行为检测等具体的应用场景中。

4.长短时记忆神经网络的编码-解码模型有哪些?举例分析其应用。

解:编码器-解码器LSTM是一个循环神经网络,旨在解决序列到序列问题,有时称为seq2seq。编码是将输入序列转化成一个固定长度的向量;解码就是将之前生成的固定向量再转化为输出序列。

5.长短期记忆神经网络在图片标注和看图说话等应用中需要注意什么问题?

解:图像标注(Image Caption)也称为图片描述,是基于图片自动生成一段文字描述,包括其中的主要元素和环境信息等。图片标注的实现难度较高,不仅要能检测出图像中的物体,而且要理解物体之间的相互关系,最后还要运用合理的语言表述。这需要综合运用图片识别、推理和自然语言生成等技术。随着深度学习技术的发展和COCO等图像标注数据集的出现,图片标注相关的技术得到了快速发展。

视觉问答(Visual Question Answering, VQA)就是对给定的图片进行问答,将图片和问题作为输入,结合这两部分信息,产生一条人类语言作为回答。针对一张特定的图片,如果机器能以自然语言来回答关于图片的某一个问题,那么机器所需要做的不仅是理解图片内容,还有理解问题的真实含义和意图,这涉及计算机视觉(CV)和自然语言处理(NLP)两大领域。最后根据输入的图片和问题,输出一个符合自然语言规则且内容合理的答案。

6.讨论生成式对抗模型的组成。

解:生成对抗网络是无监督学习的一种。所谓对抗是指其中的生成模型G(Generative model)与判别模型D(Discriminative model)相互竞争,其中生成模型是对联合概率进行建模,从统计的角度表示数据的分布情况,刻画数据是如何生成的,通过不断学习训练集中真实数据的概率分布来生成新的假样本。而判别模型通过学习确定样本是来自生成模型分布还是原始数据分布,其本质是将样本的特征向量映射成对应的标签。

生成对抗网络由一个生成网络与一个判别网络组成。生成对抗网络的实现方法是让生成模型和判别模型进行博弈,训练过程通过相互博弈使用两个模型的性能同时增强。生成模型需要在整个条件内去产生数据的分布,就像高斯分布一样,它需要去拟合整个分布。判别模型就像分类一样,有一个判别界限,通过这个判别界限去区分样本。

7.举例说明生成式对抗模型的应用。

解:近年来,随着深度卷积生成对抗网络(DCGAN)在图像领域取得了非常好的效果,之后便出现了许多变体,例如,Pix2pix。CGAN、WGAN等。其中DCGAN、CGAN、WGAN这类生成对抗网络都是以生成假图像作为目标,缺乏实际的应用场景。而Pix2pix借助条件生成对抗网络的思想,将整张原图直接输入模型中,并提出了pair的概念,即输入图像与输出图像成对出现,让判别器同时判断两个pair的真假,从而建立了图片之间的联系,实现图片到图片之间的转换。

8.迁移学习解决什么问题?

解:主要解决两个问题:小数据的问题。比方说新开一个网店,卖一种新的糕点,没有任何的数据,就无法建立模型对用户进行推荐。但用户买一个东西会反应到用户可能还会买另外一个东西,所以如果知道用户在另外一个领域,比方说买饮料,已经有了比较多的数据,利用这些数据建一个模型,结合用户买饮料的习惯和买糕点的习惯的关联,就可以把饮料的推荐模型给成功地迁移到糕点的领域,这样在数据不多的情况下可以成功推荐一些用户可能喜欢的糕点。这个例子说明,假设有两个领域,一个领域已经有很多的数据,能成功地建一个模型,有一个领域数据不多,但是和前面那个领域是关联的,就可以把那个模型给迁移过来。

个性化的问题。比如每个人都希望自己的手机能够记住一些习惯,这样不用每次都去设定它,怎么才能让手机记住这一点呢?其实可以通过迁移学习把一个通用的用户使用手机的模型迁移到个性化的数据上面。

9.迁移学习常用的方法有哪些?

解:迁移学习的实现方法包括基于样本的迁移学习、基于特征的迁移学习、基于模型的迁移学习、基于关系知识的迁移等,一般来说,前三种方法具有更广泛的知识迁移能力。基于关系的迁移具有广泛的学习与扩展能力。

10.强化学习的基本思想是什么?

解:强化学习是目标导向的,从白纸一张的状态开始,经由许多个步骤来实现某一个维度上的目标最大化。就是在训练的过程中不断尝试,错误就惩罚,正确就奖励,由此训练得到的模型在各个状态环境下都最好。

11.简述Q-学习的基本过程。

解:Q-学习是让主体从一个状态到另一个状态不断转换进行探索学习。主体的每一次探索都会从初始状态到目标状态,相当于一次迭代,训练越多,学到的东西越多。初始时会将所有状态-行动组合的Q-值初始化为0,将状态奖励值设置为初始值,主体会探索很多状态直至发现一个奖励,因此会对训练Q-函数限制一个训练长度,或者限制训练直到达到某些状态。保证主体不会卡在无用状态的学习中,避免不管做多少次迭代都无法得到有用的奖励值。

12.强化学习如何与深度学习结合?

解:深度强化学习,在这种前沿的技术中,自治代理使用强化学习的试错算法和累积奖励函数来加速神经网络设计。这些设计对依赖于有监督或无监督学习的人工智能应用有着强大的推动作用。

深度强化学习是人工智能开发和训练流水线自动化的核心研究领域。深度学习、机器学习和其他人工智能模型的设计人员在确定各种架构、节点类型、连接、超参数设置,以及其他选项时,使用深度强化学习驱动的代理能够帮助他们迅速弄清楚这些设置的优缺点。

例如,研究人员使用深度强化学习,快速确定哪—种深度学习卷积神经网络(CNN)架构最适合解决特征工程、计算机视觉和图像分类等应用中的各种难题。人工智能工具使用通过深度强化学习得出的结果,自动生成最优CNN,针对具体任务,可以使用TensorFlow、MXNet和PyTorch等深度学习开发工具。

在这方面,令人鼓舞的是出现了强化学习开发和培训的开放框架。当你研究深度强化学习时,表中列出的强化学习框架可以供你参考,这些框架与TensorFlow以及其他深度学习和机器学习建模工具有接口,利用并扩展了这些得到广泛应用的工具。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐