神秘的深度学习和强大数学理论基础的机器学习

机器学习已被广大人群认可和接受,因为每一种机器学习算法都对应这明确的数学基础:概率论与数理统计,最优化等等,但是也存在明显的局限性,人们在对比机器学习及深度学习时,喜欢概括性的说明:**传统机器学习的特征提取主要依赖人工,针对特定简单任务的时候人工提取特征会简单有效,但是并不能通用,**这句话立足于实际的每一个机器学习算法的实际开发流程,但从实际问题出发,他更多的想表达的是,机器学习并不是“完全的”自主学习,存在两点片面性,一是信息不完全性,机器学习利用的信息取决于开发者输入的特征维度,而特征维度是有限的,使用有限的特征维度输入给机器使其学习到的对象已经变成人类将对象使用工艺刀工整切割后的内容,必然存在信息的缺失,这也导致了第二点,其学习效果完全取决于人类特征选取的效率,如果能够有效的输入完美表征被学习对象信息的特征,机器学习效果堪称完美,如果不能显然将会导致性能低下学习结果一塌糊涂,有一个很好的比喻,机器学习模型像是一个学堂中的孩子,而模型构建者除了扮演原始信息的输入者,还扮演着老师,她决定如何向这个孩子输入信息能够让他更好的学习这个世界并建立自己的价值观和思辨能力,显然教师将会起到很大的作用,因为这个孩子只能坐在课堂上听老师口中讲这个世界是什么样子,一个圆润的苹果可能就被定义成红的圆的甜的物体,显然这样的训练有一定的效果,但是能力会很有限,最终这个智能体的智能属性上限可能难以与人类的婴儿相比,因此可以说机器学习是一种辅助性的人工智能,能够快速有效构建人类输入的既定的规则,但没有直接接触待学习的对象。
而深度学习,其输入并不是由特征组成的,而是使用计算机语言描述的真实对象,当然这里的计算机语言所描述的对象也不能称之为对象的原型,但相较于特征工程的描述,显然输入的原始信息要多了很多,所以这也决定了当前深度学习应用领域的局限性:适合使用计算机语言描述的对象更适用于使用深度学习,譬如图像识别(机器视觉)/自然语言处理等,没有了特征工程,深度学习认识对象的方式采用多层神经网络的方式,每一层就像一个过滤器(Filter-Bank)通过无监督聚类的方式将输入的信息自然的形成一些规则,并基于规则转化所获的信息,并层层传递,最终将提炼的信息予以转化,转化的结果就是深度学习模型的输出,这份答案将会给与评分(有监督的),并给予结果的评估反馈调整自己的学习机制,这里同样可以将深度学习模型比喻成学堂中的孩子,不同的是人类扮演的老师闭上了嘴,而是把世界摆在学生面前让学生自由发挥自己观察,而老师则会将学生观察后得到的结果给以指导,讲到这里不禁让我想到了达芬奇画鸡蛋的故事,一个优秀的老师不是将自己理解的鸡蛋告诉学生,而是将实际的物体摆在学生面前,让他自己去理解/获取/感知这个对象,最终进入这个学生脑海里的鸡蛋不在是一个简单的纺锤形的物体,他可能遍历了蛋的一声,不同成熟度,不同光线,不同温度,因此可以很直接的相较于机器学习,深度学习的优势就是信息输入的完整性,而他们的差异恐怕都不能用数量级差异来形容,毕竟寥寥数语形容一个对象简直天方夜谭,当然这些信息爆炸也会带来相应的代价,那就是计算需求的激增,还有一点是容易被世人诟病的点,那就是由于深度学习就像是个艺术家,输出的结果总在挑战人类的既定的规则,其实也很容易理解,因为他就像是个从未接收过别人理念的野孩子,看待世界的角度自然异于常规,但正如“天才在左,疯子在右”,改变和推动人类进步的从来不是墨守成规和约定成俗,深度学习结果带给人类困惑的同时往往也会有惊喜,很多意想不到的结果往往给很多事情的解决提供的新的结果,这个独辟蹊径的孩子就是这般的“没有人性又富有灵性”。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐