返回 登录
0

【旧文重温】计算机视觉与人工智能的现状:真的还非常遥远

http://img.my.csdn.net/uploads/201505/08/1431080027_4462.jpg

HN上有人贴了Andrej Karpathy 2012年写的旧文,引起了热议。

文章对人工智能发展并不太乐观,与今天大众媒体对人工智能的炒作恰成鲜明对照。Karpathy以上图为例,说明很多信息人类瞬间就能理解并发出会心微笑,我们只需要处理RGB的二维数组,用这些简单的冰山一角,利用已有知识,推导出巨大的整个冰山,这种能力是人工智能系统面临的最难任务。

计算机系统要处理其中很多微妙(三面镜子,很多人及其映射,整个场面的很多含义,包括奥巴马动作的三维意义,那个称重的人如果发现俺自己超重的心情变化,其中的物理学等等)极其困难。先不说推断算法是否能完成这么复杂的任务,怎么收集所需的数据呢?怎么着手呢?

就拿计算机视觉领域代表最新成果的Imagenet和Pascal VOC比赛中的研究水平来说,姿势估计、动作识别方面有很多工作,但都是很具体、孤立的场景,而且都未完成。总结成一句话,就是“路漫漫其修远兮”。前路漫长,充满不确定性。

Andrej Karpathy是斯坦福大学人工智能方面的研究生,师从华裔女教授李飞飞,方向就是深度学习。Imagenet比赛,斯坦福大学李飞飞组是重要发起者、组织者。作为是圈内人,他的看法很典型。

最近人工智能似乎很热很乐观,以至于霍金、盖茨和Elon Musk都开始担心发展太快,人类有风险了。但有意思的是,真正在一线做研究的人反而大多比较悲观。

这篇文章写于2012年,那么3年后作者的态度如何呢?从文后的评论来看,至少5个月前,Karpathy的态度并没有什么变化。

评论