返回 登录
0

吴韧:“异构神机”强于Google AlphaGo 专注类脑芯片、调参是错误

在人工智能领域,从业者正在通过调参乃至新的芯片研发等方式追求更好的感知性能,但在知名异构计算专家、异构智能(NovuMind)创始人&CEO吴韧看来,一些努力注定是“走偏了”,系统化的极致优化才是正确的方向,比如他的“异构神机”。

在Google DeepMind围棋人工智能系统AIphaGo对决韩国围棋第一人李世石九段之际,吴韧的团队也在筹备另一场围棋人机大战。2016年3月7日晚,在由极客帮创投、异构智能、聂卫平围棋道场联合召开的“异构智能·对弈未来”发布会上,吴韧宣布异构智能的人工智能项目“异构神机”将与世界围棋冠军柯洁进行对战(时间未定)。

图片描述

左起:蒋涛、吴韧、聂卫平、华学明、俞斌

异构神机目前为0.1版,但基于异构高性能计算平台,凭借深度学习训练而来的棋感与蒙特卡洛树搜索(MCTS)的结合,已经战胜多位业余4段围棋选手,吴韧认为异构神机无论从技术上以及训练强度上均不输于AIphaGo。

柯洁与李世石过去进行的10场比赛中,柯洁九段以8:2胜过了韩国围棋第一人。不过,柯洁目前似乎无意应战,尽管同样有极客帮创投提供100万美元奖金的刺激,柯洁认为异构神机还没有挑战他的资格(并认为状态正佳的李世石必克AlphaGo)。

柯洁是新一代的中国棋手领军人物,年仅18岁却连夺百灵杯、三星杯、Mlily梦百合杯三项围棋比赛世界冠军。在3月5日进行的第17届“农心杯”三国围棋擂台赛总决赛上,柯洁再次战胜韩国棋手李世石,帮助中国队取得三连冠的同时,也将自己与李世石之间的战绩改写为8:2。

围棋与AI

棋类游戏中,围棋是此前证明人类智力强于机器的最后堡垒,人工智能公司不约而同地把研发更强大的围棋AI当做证明其AI实力的手段。在Google AlphaGo战胜樊麾之前,Facebook的田渊栋就在微博、知乎上分享FAIR对围棋的投入和研究。而AlphaGo论文在《自然》杂志上发表之后,日本在3月1日发布了“DEEP ZEN GO”围棋项目,打出了超越AlphaGo的口号。现在,异构神机又浮出水面。

吴韧认为,战胜和取代人类不是人工智能的目的,人类智能的高效不可低估,人工智能和人类智能可以相互学习,相互促进,从而让人类生活更好,围棋人工智能是体现人工智能的一个重要通道——伴随我们几千年的围棋文化是中国的国粹,我们需要让人类智能+机器智能要配合起来,发挥出一个最高的境界。

他表示,AlphaGo出自Google,不是因为Google、Facebook的员工围棋下得好,而是他们在人工智能领域走得很远。而对于异构智能,团队的最终目标是做最聪明的人工智能,围棋程序是研究人工智能的副产品。比如用深度学习培养围棋感觉的感官智能,就是机器能对它周围的事物有感知有反映,这样的技术可以成为人类智能的辅助。

作为异构智能的投资方,极客帮创投联合创始人蒋涛也推崇人工智能的潜力,认为“人工智能在未来世界中的威力相当于原子弹中的铀元素”,挑战围棋世界冠军是人工智能技术发展的里程碑,人工智能在不远的未来深入到人类生活的各个方面,比如可以提供更专业的医疗系统。

图片描述

极客帮创投专注于人工智能、游戏娱乐、垂直社区、行业服务以及智能硬件,目前已经投资了80多家在人工智能和移动互联网创业公司。

举办此次活动,蒋涛表示,一是掌握深度学习技术的不只是Google,还包括中国的团队;二是人工智能已经成为战略资源。

围棋AI技术

当前的最先进的围棋AI,利用庞大的数据集与深度学习算法,对复杂的深度神经网进行训练,预测对手的下一步行动,配合蒙特卡洛树搜索与强大的计算能力,即可达到媲美顶尖职业棋手的水平。AlphaGo和异构神机都是采用此种方法。具体参考出门问问工程师李理撰写的AlphaGo对战李世石谁能赢?两万字长文深挖围棋AI技术(一) AlphaGo对战李世石谁能赢?两万字长文深挖围棋AI技术(二)

图片描述

吴韧在1997年做出来一个可以下中国象棋的软件“梦入神机”,曾两度获得计算机象棋奥林匹克比赛冠军,那时候是用计算的方式。从那时到深度学习出现之前,天才棋手的感觉,是计算机科学一直搞不定的问题。但现在,从原始数据到最终对比,深度学习可以自动把映射关系找出来。吴韧表示,通过深度学习系统+高性能计算,加上足够多的数据,就一定能够给我们带来一个最终的智能模型,获得和人类类似的感觉。围棋也不例外,数千万次训练以后,计算机系统也能拥有右脑感知的能力,对棋局进行估值。理性的一端则是计算,蒙特卡洛、全局搜索、局部搜索与估值网络加起来就带来非常强的智能,亦可规避AI遇强则强遇弱则弱的问题。当然,多次的训练和对弈时候的计算,哪怕是局部搜索,也都需要强大的计算资源,在超级计算机“异构”支持下才可能完成的。

所有的围棋人工智能都使用到了蒙特卡洛树搜索(MCTS),它使用蒙特卡洛算法的模拟结果来估算一个搜索树中每一个状态(state)的值。随着进行了越来越多的模拟,搜索树会变得越来越庞大,而相关的值也会变得越来越精确。通过选取值更高的子树,用于选择行动的策略概率在搜索的过程中会一直随着时间而有所改进。目前最强大的围棋程序都是基于蒙特卡洛树搜索的,通过配置经训练后用于预测人类棋手行动的策略概率进行增强。这些策略概率用于将搜索范围缩小到一组概率很高的行动、以及在模拟中抽样行动。

不论是AlphaGo、黑色森林还是异构神机,它们的神奇之处并不是它的计算能力穷尽了围棋的所有可能性,而在于它的策略选择和学习能力。它每一步棋并不试图穷举所有的可能性,而是在当前的合理范围内寻找最佳方案。简单的说,也就是它是围绕你的出招来拆招的,它在学习你然后打败你。

吴韧认为,Google DeepMind在围棋上面就是做了一个非常大规模的神经网络,谈不上真正的进步。当前世界上训练超大规模神经网络,不管是用的算法、技术,或者是高性能支撑这个训练,异构是做得最好的,现在棋感和神经网络的指标超过以前的指标。

图片描述

(计算资源方面,)我们远远领先于谷歌,是因为谷歌计算机系统用的是传统所谓高性能计算机的算法,我们是算法+硬件是一体化设计,能够达到最充分的优化。

AlphaGo项目使用了3000万围棋局面记录和最佳走步,训练了一个具有5000万参数、深度达到14层的巨大的神经网,其测试准确度达到了惊人的57%。异构智能公司自主设计和开发的NovuStar超级计算机专门为解决人工智能问题特别设计,可训练数个更大更深的神经网,从而让“异构神机”具有比AlphaGo更加准确的棋感,达到58.2%。由此棋感神经网引导的蒙特卡洛对策树搜索也就更为高效。

对于目前一些团队专注于在应用、框架、芯片等不同层面进行的人工智能研究,吴韧认为是走错方向了,他更希望是在垂直上做最极致的优化,智能的研究可以看作是一个完成的系统,包含有芯片,包含有软件、包含有算法等各种组成部分,帮助人类解决具体的某一些应用。

异构智能技术团队基于惠普、AMD、百度、Intel等公司的异构计算经验,使用认为最合适的芯片、软件和算法类型来做高性能计算系统。对于神经网络芯片(类脑芯片),吴韧认为,这需要重新编写系统代码,不是好的选择。

目前,异构智能公司已经汇聚了一个20人的技术团队,建成了专为开发人工智能设计的超级计算机,并开发出了利用超级海量数据,用算法训练超级巨大和复杂的深度神经网的成熟技术。其中,创始人吴韧曾先后在HP、AMD、百度等国际巨头中从事过计算平台的研究和建设;副总裁Chien-Ping Lu博士是世界著名的GPU芯片设计和异构计算专家,曾负责过nVidia、MediaTek、Intel等多项重要芯片设计;而副总裁Kar Han Tan博士则是世界知名的计算机视觉尤其是立体视觉专家,曾担任HP Sprout产品线技术负责人。

而对于细节的调参问题,吴韧也认为,调参是走偏了方向。

如果你已经发现调参数非常困难的时候,说明这个优化已经变得非常艰难了,你做的是寻找一个非常难解的解,你需要为这个问题找一个非常容易的解。

职业选手眼中的围棋AI水准

尽管AlphaGo已经5:0大胜樊麾,自称在计算机方面是“大大的外行”的棋圣聂卫平对当前机器智在围棋领域能能够战胜人类智能表示极大的怀疑。在他看来,樊麾并没有表现出职业水准,不足为凭。柯洁的态度,也是如此。

图片描述

聂卫平解释,虽然计算机的能力进步很快,但围棋的变化数361!本身就是一个无限大的数,而且中间还包含很多变化,如打二还一、打三还一、打劫、倒扑,每一种变化有很多。围棋有一种判断,一个情况产生几百个变化的参考图,每一个参考图都有一种对这个局面好或者是不好的判断,这不是计算,这对现在的计算机而言是一个不可逾越的技术障碍。

事实上,AI界都知道,聂卫平所说的“判断”,也就是AlphaGo的“Value Network”,或者异构神机的“棋感”,虽然这种感觉可能目前还不足以和人类相提并论,但至少意味着棋圣变相承认围棋AI战胜人类的潜力了。吴韧认为,经过足够多的训练之后(如几千万的训练样本),围棋AI就能够获得这种棋感,而且做好之后AI会比人类更快地获得感觉和进步。

中国国家围棋队领队华学明以及总教练俞斌则表示,如果机器能够战胜人,则人类棋手可以多出一个不错的学习平台,对于围棋教学普及各方面都有很大的好处。

具有20多年编程经验、自评为编程业余六段的俞斌,原本觉得打劫尤其是连环劫是程序语言难以解决的,也就是说AI不会战胜人,但震惊于基于深度学习的围棋AI的实力,他认为人工智能最重要的瓶颈已经突破,电脑程序战胜人是迟早的事情。

图片描述

图片描述

根据蒋涛在朋友圈的分享,俞斌在发布会后在MacBook上连夜测试异构神机。

链接:异构神机测试版详解 电脑只凭棋感不计算(谱)

评论