返回 登录
0

H2O.ai首席架构师:深度学习的普及还有两大障碍

阅读2028

图片描述

RE•WORK市场总监Sophie Curtis与分布式可扩展开源机器学习平台H2O.ai的首席架构师、开源代码库主要committer之一Arno Candel的对话:

哪些行业受深度学习上影响最大?

物联网时代的到来导致数十亿的设备以某种人工智能的形式运行。无论是农业的产量控制系统,零售业的个性化推销,公用事业的家庭自动化,金融领域的P2P借贷,还是汽车行业的自动驾驶,我们即将见证深学习技术应用带来的显著变化。

深度学习最新发展的主导因素?

这是硬件、软件和数据民主化的结果。随着计算机和大型标记数据集更容易获得,神经网络的研究近年来已经开花——这两者都是深学习的关键。同时,最近几年开源软件的成熟,让数百万计人可以获得世界一流的机器学习工具。

该领域未来必要的进步?

在生产环境中有一个强壮的和可扩展的系统,与在出版物上阅读新方法,二者之间存在巨大的差距。大多数组织对特定深度学习的进步和通用机器学习不知所措,许多人仍局限于过时的基于规则的或简单的统计模型,这些模型的表现远远落后于业界发展水平。

采用深度学习的障碍之一,是缺乏生产就绪的、以可扩展的和强壮的方式吸纳最新研究成果的工具。数据科学家不应该实现和调试算法,他们的时间应当更好地用于获得洞察力和优化工作流程。另一个障碍是一些复杂的模型有令人难以置信的精度,却缺乏解释性。决策者对难以理解或无法理解的部署模型犹豫不决。在不牺牲精度的情况下改善模型解释性和减少模型的复杂性,需要更多的工作。

H2O.ai的下一步工作?

H2O.ai的工程师正在改进现有的机器学习算法,并增加新的算法,但我们的工作重心是提高在大数据集上运行可扩展的机器学习工作流程的客户体验。因此,我们在质量控制和客户支持花了很多精力。

深度学习在未来5年的发展?

期待深度学习技术将来有更高的计算效率。目前深学习技术还是对太计算饥渴(too power-hungry),甚至简单的概念仍然需要太多的蛮力(brute force)来训练。希望我们可以减少训练的复杂性,以一套更简单的、可以实现同等甚至更好的学习性能的基本构建模块来终结。这类似于在物理学上找到一个统一的理论(Arno Candel的背景是HPC和物理),如狭义相对论或者量子电动力学,优雅地解释以前几乎无法表达的概念。深度学习领域也有一些工作往这个方向推进,如Recurrent Neural Networks。其他想法包括Hinton在模型压缩和专家网络(specialist networks)上的“黑暗知识(dark knowledge)”的概念。

原文:SCALABLE DATA SCIENCE AND DEEP LEARNING WITH H2O.AI

评论