郑南宁院士会议演讲——直觉性AI与无人驾驶(上)
博主最近参加了2018年中国机器人学术年会,觉得郑院士的报告很有深度,所以先把人工智能部分整理出来与大家共勉: 人工智能的四个阶段1960-19801980-20002000-未来将知识/规则交给机器搜索将特征/答案交给机器学习将...
博主最近参加了2018年中国机器人学术年会,觉得郑院士的报告很有深度,所以先把人工智能部分整理出来与大家共勉:
人工智能的四个阶段
1960-1980 |
1980-2000 |
2000- |
未来 |
将知识/规则交给机器搜索 |
将特征/答案交给机器学习 |
将原始数据和答案交给机器深度学习 |
将目标交给机器 增强学习 混合增强学习 |
五大学派
符号主义 |
联结主义 |
行为主义学派 |
贝叶斯方法 |
类推学派 |
认知即计算 使用符号/规则和逻辑来表征知识和进行逻辑推理,常用算法:规则和决策树 |
认知即网络(比符号主义更加底层)使用概率矩阵和加权神经元动态地进行模式识别与分类 基本算法:神经网络(深度学习) |
基于“感知—行动”的行为智能模拟方法;生成变化,为特定目标获取其中最优的 基本算法:反馈控制/遗传算法/蚁群算法/强化学习 |
获取发生的可能性来进行概率推理,常用方法:朴素贝叶斯和马尔可夫过程,面向向量的统计模型,统计学习方法 |
根据约束条件来优化函数,常用算法:支持向量机等 |
符号化人工智能的局限性
- 需要对问题本身抽象出一个精确数学意义上的解析式数学模型
- 一旦模型建立,计算任务与能力就被唯一确定
- 确定的算法无法表示现实世界问题所固有的测不准性和不完备性
- 图灵意义下的可计算问题都是可递归的
深度学习的局限性
- 过度依赖训练数据
- 若泛化能力(训练和测试样本强同分布)
- 缺乏推理和对因果关系表达能力
- 无法在计算过程中实现有效的注意机制
人类对图像/声音和语言的理解来自人类的感觉运动经验和知识,机器学习模式无法获得这种体验,因此无法以任何人类相关的方式理解他们的输入。
算复杂性与指数爆炸
经典人工智能的基本理论框架:“演绎逻辑和语义描述”与“形式化方法”;
形式化方法不可能为所有的对象建立模型:
- 条件问题(Qualification Problem):不可能枚举出一个行为的所有先决条件
- 分歧问题(Ramification Problem):不可能枚举出一个行为的所有隐性结果
人类面对的许多难题只可能在指数时间内获解(即计算时间与输入规模的幂成正比),一些问题的解决需要近乎无限长的时间
莫拉维克悖论
对计算机而言,实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等低等级智慧却需要巨大的计算资源。
发展新一代人工智能需要回答以下问题:
- 什么事人类智力所独有的特征?
- 要做到像人类一样用友智能行为,计算机需要什么能力?
- 人类认知的所有高级形式—概念形式、推理、问题求解、创造以及记忆和知觉——不与智力相关?
人类大脑独特的性质
- 大脑不是通过一个统一的、未分化打的神经网络实现单一的全局优化原理来学习的
- 大脑是模块化的,具有独特且相互作用的子系统支持认知功能,如记忆、注意、语言和认知控制
- 大脑神经网络结构的可塑性,以及人脑在非认知因素和认知功能之间的相互作用,它们是形式化的。
- 要想机器学习模型产生人类的认知结果,需要其所学的特征在一定程度上符合大脑生理学实验结果,同时要使特征具有数学和语义的解释性
从连接到认知
研究大脑网络的聚合和分离来洞察大脑的认知机理
- 结构连接:解剖学意义上的纤维束连接关系
- 功能连接:与任务相关的基于统计学的依赖关系
- 有效连接:神经元之间因果互动和相互影响关系
大脑的结构连接是相对静态的,而功能连接和有效连接具有时空动态演化特性。由功能连接和结构连接可以推测有效连接,有效连接的分析是计算大脑产生成本函数和寻找最优参数的过程
发展受脑认知和神经科学启发的人工智能
- 从人的大脑记忆、学习与预测的机制来看,现有的深度学习及基于语义和逻辑推理的图灵计算架构不能更有效地实现一种通用的人类认知信息加工机制
- 以脑认知和神经科学与机器学习相融合有可能构建出一种类脑的“学习机器”而不是单一的“机器学习”
基本科学问题
- 大脑如何实现优化?
- 脑网络的监督信训练信号从哪里来?它们如何体现不同任务的成本函数?
- 在不同的神经功能连接区域中,存在什么样的有效连接来约束和优化与任务相关的成本函数?以有效的找到特定问题的解决方法?
- 如何实现深度神经网络混合模型的自动构造?
传统深度学习与类脑神经计算
问题:如何将深度学习端到端的单一任务目标优化步数到新的任务
(A)传统深度学习的监督训练依赖外部的标记数据
(B)脑网络的监督训练能通过误差信号的梯度信号下降静态发生;但误差信号是由内部生成的成本函数产生
(C)成本函数和皮质深度网络的误差驱动训练部分组成了一个更大的包含数个专门系统的架构
认知映射
人类理解或描述物理世界时,大脑总会形成一种对时间的“可视化”图像:环境模式表征的认知地图
直觉推理(物理世界的直观理解)
人的“直觉反应”是在解空间中寻找全局最优解-最好的“解”
- 当前的认知映射的形成与大脑对外部信息的感知和理解相关
- 认知映射与成本函数生成的一系列决策活动是一个不断地模式匹配的迭代过程
认知推理
构建学习与思考类似人类的机器和基本核心要素
物理层面的认知推理
可跨越时间与空间追踪事物的发展轨迹
心理层面的认知推理
学习方向收到心理状态的引导
使机器像人一样对物理世界直观理解
实现物理层面认知推理的基本要素
(1)物体(或对象)特征的识别、并形成短期记忆
(2)物体(或对象)之间的相互关系与作用的直观理解
(3)基于想象力的行为模型产生
直观物理层面推理的基本框架.
- 构造一个内部预测模型,在行动之前预想到结果
- 基于环境的模型提取有用的信息
- 规划想象的行为最大化任务效率
混合智能计算模型
结语
直觉:以一种最少的假设去描述一个系统或产生相应的行为
人类大脑对世界的印象是一个不完整的世界的描述,但这个不完整的世界确实人类直觉判断和逻辑思维的基础
面对真实世界的变化,将直觉与经验(或知识)和以数学为基础的演绎归纳结合,能够在不完整的世界描述中产生正确的行为
更多推荐
所有评论(0)