返回 登录
0

关于深度学习的一些真相

让我们一起开始吐槽深度学习吧!尽管花了两年研究并撰写关于深度学习的论文,但还是被学习算法的一些错误信息搞得晕头转向。

这篇博客不是讨论深度学习是否被过分夸大,关于这个问题的讨论已经有完善的记录。

这篇文章的出发点是(希望)给出针对深度学习清晰、简洁的理解及意义。虽然这里有关深度学习的讨论或者咆哮没有经过深思熟虑,但是这里的要点是鼓励机器学习社区对深度学习要有清晰的思考。让我们本着科学的态度试着大胆地讨论这项技术能否产生人工智能。毕竟,我们不就是这个领域的领导者或者说少数能够理解其复杂性及影响的人吗?既然有关人工智能的突破进展和非业内的评论家对深度学习都能做出武断的判定改变这个世界,为什么不在这个世界中加入我们的吐槽呢?感觉我们似乎只是坐等别人为我们指出道路。

[05/05/16补充:请记住这只是一篇博客,不是什么学术论文。这里的目标是表达我的思想并激发一些能够专注深度学习而非技术争执的讨论。很明显,这几百字的讨论不可能有什么深度,这里的目标只针对机器学习的门外汉。文章中为读者留下了一些技术讨论练习(欢迎随时给我联系)。一篇文章不可能适用于所有人]

问题

即使是我们之中学术造诣最深的人都犯了这个错误,在讨论中将深度学习两种截然不同的流派混淆在了一起:

1 神经网络比其他学习算法的好处更多。
2 “深”神经网络架构比“浅”架构的好处更多。

大多数的争论都与第1点而不是第2点有关。首先要明确,神经网络创立的灵感、优点和缺点都有相关的文字记录。为什么还要重新争论?没有什么比争论“为什么深度神经网络要‘仿照人类大脑工作’”这样问题更令人沮丧的了(事实与题目的描述对不上),“深度学习是真正开启人工智能的关键”这样的题目也是如此。这是明显的偷换概念,与过去刚引入神经网络时候的讨论没有区别。

这里我的意思是,对于真正的目标没有给出正确的问题。如果我们把深度神经网络放在不断增长的人工智能世界中考虑,那么就必须回答接下来这个问题:提升计算能力,为神经网络添加层次,这么做究竟能比普通的神经网络带来怎样的改进?给出这个问题答案的过程才是对深度学习真正富有成果的讨论。

答案(?)

以下是我对第二个问题的个人见解:深度神经网络相比传统的神经网络在下面两个地方更有用处:

1 对功能编码从手动变为了自动。
2 支持相关功能结构开发或空间开发。

虽然这么说有过于轻率的风险,但如果你发现有其它没有包含在这两条特性中的优点,请告诉我。就我目前涉及的深度学习工作而言,只有上面的两条。

[05/05/16增加备注:在回复中,提到最多的第三个优点是模型内部可配置。这是优点没错,但它既不是新特点,对深度学习而言在哲学上也不具有唯一性。从根本上说,这仅仅是管道的一种无摩擦版本。这项工作我们已经开展了一段时间。我还没有听说分解证明这个结论的好论点。

如果上面的是事实,在学术领域我们可以有怎样的期待?我们可以期待深度神经网络在这些场合下非常有用,例如数据能够具有空间质量的一些特性,像图片数据、声音数据、自然语言处理处理等。虽然我们可能会说有很多空间开发带来的好处,但是对所有要求处理的数据并没有显著的改善。“深度学习 deep learning”单词并不是治疗癌症的灵丹妙药(除非能够找到某种与癌症相关的空间拓展,与人类基因组的处理方式类似)。深度学习不可能出现自己开始思考或突然变得有感情。我们可能希望看到自动驾驶汽车只是简单地帮助我们把车开在两条交通标线之间,但是它不能决定究竟是保护司机还是横穿马路的行人。令人痛苦的是,那些真正读过有关AlphaGo 论文的人会意识到深度学习仅仅被传统AI算法用作工具。最后我们发现,再一次强调Golden mean是准确无误的,而深度学习虽然不能够解决所有的机器学习问题,但也不是没有依据的。

既然自我感觉良好,那就再做一个预测:**深度学习不会产生通用算法。原因不是无法创建一个复杂的系统。然而,深度学习是一个非常好的有用工具。对AI来说什么是最有用的?我的预测是,最有用的会是感官学习系统(视觉、听觉等),能够开拓数据的一些空间特性,否则这些数据毫无用处。最典型的就是AlphaGo,必须用作一个人工智能系统真正的输入。

停下对深度学习的研究,这些工作会让所有的算法变得毫无用处。不要每遇到一个数据集都抛出深度学习进行处理。运行你的工作包中把“hello world”之外的示例试验一下,你会很快发现他们的真实用处。最重要的是,不要把深度学习当做“万能”的算法,而是真正了解它的用处:一种辅助计算机感知的工具。

原文:The Truth About Deep Learning
作者: Clay McLeod
译者:赖信涛
责编:钱曙光

评论