返回 登录
6

OpenAI提出机器学习新途径:进化策略

原文:Evolution Strategies as a Scalable Alternative to Reinforcement Learning

OpenAI团队在EmTech Digital大会上介绍了一种新的机器学习方法。

OpenAI总监Ilya Sutskever昨天在EmTech Digital大会上介绍了人工智能领域下一个可能的爆发点。OpenAI是一家独立研究机构,EmTech Digital是MIT的科学杂志《科技回顾》所组织的大会。

Sutskever介绍了一种新的机器学习研究方法,它的效果比现在已经产生巨大突破的方法还要好。他的技术的扩展性可能也会更好。

这篇博客文章里,Sutskever和同事们采用“进化策略”让机器理解一项复杂的任务。研究人员说,此方法与几十年前的方法颇有渊源,它涉及使用模拟进化过程的优化算法。这些技术的本质就是让机器根据实验和优化,找到解决复杂问题的最佳方法,它可以被应用在机器人、自动驾驶和其它领域。

OpenAI的研究人员将他们的进化策略与强化学习方法做比较,后者在近些年取得了令人瞩目的成果,包括计算机战胜围棋世界名将(参见《10项重大技术:强化学习》)。强化学习的原理来自于动物从实践经验中学习的过程,让机器能够解决我们人类很难或者不可能用代码描述的事件。

不同于强化学习,进化策略可以让机器使用更少的计算资源来学习。强化学习通常会用到反向传播的方法来减小神经网络的误差。进化策略则采用更简单的优化技术。

“这个方法非常有意思,可能会开启一个全新篇章”Pedro Domingos说,他是华盛顿大学的教授和《The master algorithm》一书的作者。

Domingos质疑这项技术是否能超越强化学习,但他又补充到,“机器学习领域存在着大量简单方法战胜复杂算法的先例。我们需要耐心等待百花齐放的场景”。

人工智能领域需要有影响力的技术突破来维持近些年的快速发展势头。

人工智能近些年已经颠覆了整个科技界,目前正在医疗健康、教育、交通和制造业等行业寻找实践项目。举个例子,深度学习利用大规模神经网络模型挖掘大数据中的模式,推进了语音识别和图像识别技术在医学研究和医疗健康领域的应用。

然而,与此同时我们也发现这些技术并不能解决所有的人工智能应用项目。探索新机遇和持续性创新是EmTech Digital大会的突出主题。

即使新技术层出不穷,比如强化学习和OpenAI的进化策略方法,终极目标,即某种意义上的通用人工智能,仍然是一个遥远的愿景。

但是,随着强大的机器学习技术不断地向新兴行业和日常生活领域扩散,它也可能会给我们带来意想不到的效果。

出席EmTech Digital的演讲者们也讨论了被嵌入在机器学习算法中的偏见指导,它将影响机器做出的重大决策,比如该罪犯的合适量刑年限,客户是否符合贷款条件等等。

随着机器学习应用在生活的各个领域,这一问题将变得更加重要,并将引发严重的伦理讨论。这又是EmTech Digital大会的另一个主题。


图片描述

图片描述

评论