深度学习-80:展望深度学习的未来
深度学习-50:展望深度学习的未来;深度学习的理论进展;语音识别领域的研究现状;图像识别领域的研究现状;自然语言处理领域的研究现状;人工智能的产业进展;人工智能的未来;通用人工智能;奇点来临
深度学习-80:展望深度学习的未来
深度学习原理与实践(开源图书)-总目录, 建议收藏,告别碎片阅读!
由于算力和理论的突破,卷积神经网络(Convolutional Neural Networks)在很多领域开花结果。本章介绍相关领域进展。
加入我们,一起阅读和完善: 机器学习&深度学习原理与实践(开源图书)。
告别碎片阅读,构成知识谱系。
1 深度学习的理论进展
深度学习理论的突破和云计算理论的突破,语音识别,图像识别和自然语言处理等领域的重大难题均被深度学习攻破,相关论文和产品如雨后春笋般出现。
1.1 语音识别领域的研究现状
长期以来,语音识别系统大多是采用高斯混合模型(GMM)来描述每个建模单元的概率模型。由于这种模型估计简单,方便使用大规模数据对其训练,该模型有较好的区分度训练算法,保证了该模型能够很好的训练。在很长时间内占据了语音识别应用领域主导性地位。但是GMM实质上一种浅层学习网络模型,特征的状态空间分布不能够被充分描述。而且,使用GMM建模数据的特征维数通常只有几十维,这使得特征之间的相关性不能被充分描述。最后GMM建模实质上是一种似然概率建模方式,即使一些模式分类之间的区分性能够通过区分度训练模拟得到,但是效果有限。
从2009年开始,微软亚洲研究院的语音识别专家们和深度学习领军人物Hinton合作。2011年微软公司推出基于深度神经网络的语音识别系统,这一成果将语音识别领域已有的技术框架完全改变。采用深度神经网络后,样本数据特征间相关性信息得以充分表示,将连续的特征信息结合构成高维特征,通过高维特征样本对深度神经网络模型进行训练。由于深度神经网络采用了模拟人脑神经架构,通过逐层的进行数据特征提取,最终得到适合进行模式分类处理的理想特征。
1.2 图像识别领域的研究现状
OpenCV开源计算机视觉软件包极大的促进了图像识别的发展。从OpenCV软件包的版本升级即可发现深度学习的影响力,当前OpenCV集成了深度学习子软件包,相对于传统机器学习方法,深度学习在图像识别领域具有不可比拟的优势。基于深度卷积神经网络AlexNet取得2012年的ImageNet竞赛的冠军,AlexNet网络包含了8个学习层:5个卷积层和3个全连接层。Krizhevsky等人成功借助了ImageNet这个足够大的数据集,借助了GPU的强大计算能力,借助了深层的CNN网络,借助了随机梯度下降(SGD)和Dropout等优化技巧,借助了训练数据扩充策略,最终赢得了2012年的ILSVRC,实现了top-5的错误率为15.3%的好成绩。从此各种深度卷积神经网络粉墨登场,均取得不错成绩。
1.3 自然语言处理领域的研究现状
自然语音处理是传统机器学习长期称霸的领域,人工神经网络由于多种原因从未被重视。美国NEC研究院最早将深度学习引入到自然语言处理研究中,其研究院从2008年起采用将词汇映射到一维矢量空间和多层一维卷积结构去解决词性标注、分词、命名实体识别和语义角色标注四个典型的自然语言处理问题。他们构建了一个网络模型用于解决四个不同问题,都取得了相当精确的结果。总体而言,深度学习在自然语言处理上取得的成果和在图像语音识别方面相差甚远,仍有待深入研究。
2 人工智能的产业进展
2.1 智能语音助手
Siri,Alexa,Google Assistant和Cortana,由最大的几家技术公司开发出来的这些语音助手已经成为我们日常生活的重要组成部分。语音助手背后归功于深度学习感知技术。
- 2011年,苹果公司在iphone中集成了siri语音助手;
- 2014年,亚马逊推出一款全新概念的智能音箱Alexa;
- 2014年,微软公司推出 Cortana 数字语音助理;
- 2016年,谷歌I/O大会推出语音助手Google Assistant;
- 国内的BAT均通用硬件和软件服务的方式直接或间接的推出智能语音助手产品,以期抢占下一个技术风口。
2.2 智能游戏
- 1998年,IBM的深蓝战胜了世界象棋冠军
- 2012年,Google的Alpha GO战胜了世界围棋冠军,李世石。
- OpenAI建立了广泛的游戏数据集,可以训练上千种流行游戏
2.3 自动驾驶
- 百度Applo开源
2.4 工业机器人
- 上海洋山港,自动装卸机器人
- 京东自动送货机器人
2.4 战争机器人
- 俄罗斯的扫雷机器人
3 人工智能的未来
3.1 通用人工智能
2000年以来,人工智能的研究、产品开发和创业项目如雨后春笋般出现,多种市场主体(公司、VC、高校和政府等)纷纷摩拳擦掌,希望在这个新领域领先。以斯坦福为首的“AI指数”试图构建一个衡量人工智能技术进步的基准,旨在为高速迭代的人工智能,提供可深入可讨论和可评估的基础信息。AI指数[1]的报告作者Yoav Shoham认为,在过去的十年中,人工智能已经取得了令人惊叹的进步,但即使是与5岁的人相比,计算机依然缺乏常识或通用的智慧。”。在特定垂直场景,单一优化目标,人工智能已经有惊人的表现(翻译和棋类游戏等),能在几天或几周内达到大师级的水平。在混合场景,人工智能表现就手足无措了,人工智能社区给出的模型没有通用智能特征。LeCun也认为,“在特定的领域,机器的确有超人的表现,但就通用智能而言,我们的人工智能甚至还不如老鼠聪明。”
婴儿并不需要太多的外界信息数据的获取,就能够进行一些决策的反馈,例如对声音、光线等的反应,而今天的人工智能解决方案,多数基于卷积加速芯片、大数据、精准领域拟合算法的综合应用,与人脑智能大相近庭。通用人工智能,正是人工智能下一个需要攻坚的方向。当人工智能研究进一步深入以后,将会和哲学、社会学、心理学等各种学科发生更多的关联,技术的飞速发展可能让这一过程更快地到来。
3.2 人机合一
自从人类在1924年发现脑电波可以被记录以后,科学家们一直在尝试大脑与设备的连接技术,希望通过大脑直接控制机器。未来以来,再未来几十年,科学技术把人类的智慧从生物形态延伸到信息形态,从而实现对人类智慧的模仿、重构甚至升华人工智能。初期智能终端扮演的就是脑细胞、无数脑细胞通过超宽带接入汇集成云脑,云脑通过进一步感知、计算、演进又刺激终端演进,最终实现人机合一,人类将实现从碳级生命到硅级生命的演进。人类未来将迈向智慧社会,智慧时代机器人或人机混合体才是主宰。
3.3 奇点来临
人工智能电影揭开了人工智能时代的序曲,精品大片《黑客帝国》《盗梦空间》《源代码》等,均给我们带来前所未有的震撼。著名的曼哈顿工程中,冯.若依曼和乌拉姆对话中提到“不断加速的科技进步,以及对人类生活模式带来的改变,似乎把人类带到一个可以成为奇点的阶段。在这个阶段以后,我们目前所熟知的人类的社会、艺术和生活模式,将不复存在。”。谷歌工程总监雷.库兹韦尔将奇点概念在人工智能领域无限放大,认为当计算机的智能跨越某个临界点之后,人类的知识单元、联结数目、思考能力,将旋即进入令人眩晕的喷发状态,一切传统的习以为常的认知、理念、常识,将不复存在,新的智能体或人机复合体将登上王座。
雷.库兹韦尔以其智能语音识别领域的杰出成就,成为硅谷半人半仙的人物。他创立了加速回报定律,该定律认为:信息科技的发展按照指数规模爆炸,导致存储能力、计算能力、芯片规模、带宽的规模暴涨,进而推论出以下的预言和结论。
- 2029年,新一代人工智能将通过图灵测试,非生物意义的人将出现;
- 大脑新皮质模型即思维的模式识别理论:人的大脑记忆是层次结构,有3亿规模的模式识别器;
- 大脑新皮质具有模式识别和分层学习能力;
- 大脑新皮质具有创造力、自信、组织能力、感染力等;
- 人工智能并非严格复制大脑,相当于对等模拟;
- 仿生新皮质在改造世界的过程中极其重要;
- 信仰对人类和人工智能同等重要;
- 进化创造大脑的原因是遇见未来。
系列文章
参考文献
- [1] Ian Goodfellow, Yoshua Bengio. Deep Learning. MIT Press. 2016.
- [2] 焦李成等. 深度学习、优化与识别. 清华大学出版社. 2017.
- [3] 佩德罗·多明戈斯. 终极算法-机器学习和人工智能如何重塑世界. 中信出版社. 2018.
- [4] 雷.库兹韦尔. 人工智能的未来-揭示人类思维的奥秘. 浙江人民出版社. 2016.
更多推荐
所有评论(0)