1.meta learning的出现

Meta Learning,元学习,也叫 Learning to Learn(学会学习)。是继Reinforcement Learning(增强学习)之后又一个重要的研究分支,它的发展历程和动因可以归纳如下图:

meta-learning发展历程

举个例子,把棋盘变大之后AlphaGo还能行吗?目前的方法显然是不行的,AlphaGo会立马变成傻瓜。而我们人类分分钟就可以适应新的棋盘。再比如人脸识别,我们人往往可以只看一面就能记住并识别,而现在的深度学习却需要成千上万的图片进行训练之后才能做到。

人类之所以能够快速学习的关键是人类具备学会学习的能力,能够充分的利用以往的知识经验来指导新任务的学习。因此Meta Learning成为了新的攻克方向,核心问题就是要让人工智能自己学会思考,学会推理。

我们在现实生活中往往会遇到很多新任务,现在的深度学习因为无法快速适应新任务,就没办法替代人类工作。而一旦AI具备了这种快速学习的能力,例如机器人,才能够真正走进千家万户。因为每个人对机器人的使用都不一样,每个家庭的环境也都不一样,只有机器人具备了快速学习的能力,不需要预先训练,才能适应各种各样的要求。

因此,要让机器人走进千家万户,我们需要机器人能够实时学习,不断学习,快速学习,即使面对一个新的类似的任务,也能快速掌握。这样的机器人会非常强大,能真正处理各种任务!

因此,在深度增强学习的大框架下,我们还需要:

  1. 终生学习Life Long Learning
  2. 少样本学习Few Shot Learning
  3. 多任务学习Multi Task Learning
  4. 多智能体学习Multi Agent Learning
  5. 学会学习Meta Learning/Learning to Learn
  6. 迁移学习Transfer Learning

也就是说,从机器人的角度,我们希望机器人能够实现的智能决策需要具备以下几点:

  1. 能够不断通过与环境交互来学习提升决策能力,也就是终生学习
  2. 能够快速学习,面对新的任务,可以通过少量的训练就掌握
  3. 可以处理多种任务
  4. 可以实现多智能体的协作完成任务
  5. 能够学会学习,这和快速学习本质是一样的,就是发现学习规律,面对新任务可以快速入手
  6. 这也和快速学习的目标一致,希望通过迁移以往学习的经验来加速新任务的学习。

这都是一些研究分支,但目的都是希望机器人能够和人类一样具备快速学习的能力,能够累积经验,这样的机器人才有可能具备强大的智能决策能力。但是,快速学习,或者说学会学习Meta Learning应该是最关键的技术,是实现通用人工智能AGI的必经之路!

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐