返回 登录
0

【CCAI 2016专访】今日头条李磊:研发不能只靠有监督学习 知识表示框架是未来AI核心

8月26日至27日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会发起主办、中科院自动化研究所与CSDN共同承办的2016中国人工智能大会(CCAI 2016)在北京辽宁大厦盛大召开,这也是本年度国内人工智能领域规模最大、规格最高的学术和技术盛会,对于我国人工智能领域的研究及应用发展有着极大的推进作用。大会由CSDN网站进行专题直播,并由百度开放云提供独家视频直播技术支持。

在本次大会的“机器学习的明天论坛”中,今日头条科学家、头条实验室总监李磊博士发表了题为《会思考的通用智能机器还有多远?》的演讲,对人工智能的内涵、进展以及面临的挑战三个方面进行了阐述,并接受CSDN记者专访,结合今日头条的研究/研发经验分享了人工智能在实际应用中应当注意的问题,以及未来的关键技术方向。

图片描述

今日头条科学家、头条实验室总监李磊博士

李磊博士,今日头条科学家、头条实验室总监,原百度美国深度学习实验室少帅科学家。上海交通大学计算机系本科,卡耐基梅隆大学计算机系博士,毕业论文获美国计算机学会SIGKDD最佳博士论文之一。曾于微软研究院、Google、IBM TJ Watson、加州大学伯克利分校工作。研究方向为深度学习、概率模型与推理、自然语言理解。

人工智能的定义与作用

李磊博士援引Stuart Russell和Peter Novig在《人工智能:一种现代方法》一书中对人工智能的两种定义:类人智能和理性智能。

  • 类人智能的目标是让机器像人那样思考、决策、解决问题,具备学习能力和行动能力。
  • 理性智能是研究如何通过计算方法达到合理的感知、决策、解决问题、学习和行为能力。不是和人去比较,而是把计算导出的智能看成自然现象。

李磊认为人工智能可以解决工作效率和质量的问题。以今日头条为例,作为一个鼓励用户创作和内容分发的平台,其实现需要有一个好的推荐算法技术来支持。在这个过程中,今日头条依靠人工智能技术来提升效率和质量。在过去半年时间当中,今日头条发现依靠前沿的人工技能可以大大提高他们最关心的四个环节的效率和质量,分别是:内容的创作,内容的分发和推荐,社区的讨论,以及最后的是审核环节。

监督学习目前最成熟,但好的知识表示框架才是关键

访谈中,李磊说道,整个人工智能领域到现在解决得最好的问题是有监督学习。从2006年到现在的10年时间,最热门的深度学习是解决监督学习这一类问题行之有效的方法,很可能是迄今最有效的方法。但我们在实际的产品研发过程中和实际生活当中需要用来解决的人工智能问题不只是有监督学习,而且需要用的方法也不仅仅是深度学习。李磊认为,我们需要解决的是更多更难的问题,比如逻辑推理或让机器人有更通用的能力。今日头条最近和同北大计算机所万小军教授团队合作研发了新闻写作机器人Xiaomingbot,里约奥运期间它在16天内发布450多篇新闻报道,并且这些报道的可读性非常高,已有超100万用户阅读。但是,要让机器人具备通用能力还是比较棘手的,Xiaomingbot目前可以写体育类新闻,要让他写科幻小说仍然难度。

李磊进一步表示,通用人工智能里面需要解决的问题,最核心就是找到理想的知识表示框架,这个框架需要既能够通用的表示各种各样的知识,同时还有一些高效的计算方法,可以对这个表示方法做快速的计算。

头条实验室的三个研究方向

头条实验室现在做的主要工作包含三个方向,分别是机器学习、自然语言理解和计算机视觉。具体成型的技术应用项目,包括即将问世的自动问答机器人。头条实验室最近在国际自然语言大会(ACL2016)上面发表的一篇论文《CFO: Conditional Focused Neural Question Answering with Large-scale Knowledge Bases》,该技术使得自动问答机器人在回答知识类的问题上可以达到世界第一大准确率,这些问题通常非常困难,候选答案可能就有几千万个。而头条实验室训练数据只有10万个,但回答准确率达到75%,同类世界第二的机器人是Facebook发明的,准确率是62.9%,差距大约是12%。

头条实验室还有另外一项工作,就是概率程序语言(PPL)的推理,其论文《Swift: Compiled Inference for Probabilistic Programming Languages》被2016年国际人工智能联合大会(IJCAI2016)录用。Swift技术把概率逻辑推理速度提升100倍,大幅度超过微软(剑桥研究所)、麻省理工学院、哥伦比亚大学等单位研发的同类系统。

概率程序就是一种知识表示框架,它的核心思想是能够设计出一种程序语言,让很多非专业的人都可以学会。应用这个系统的人可以是心理学家,社会学家,甚至产品设计人员,他们有各自的需求、各自的问题,但都可以用这个语言来描述他们领域里需要处理的问题。他们不需要太熟悉了解机器学习,就可以使用一个通用的计算引擎,自动地用程序语言描述这个问题,自动地推理。这是概率程序语言需要解决的实现目标。

头条实验室的研究挑战

关于技术研究上的难题,李磊表示,每一项工作几乎都是非常困难的,就像黑暗当中去寻找一点光明。头条实验室的每一项工作,包括前面提到的自动问答、写稿机器人,以及概率推理引擎,都需要投入大量的时间和精力。其中概率推理引擎这项工作是2012年李磊在加州大学伯克利的时候就开始有的想法,已经做了非常多的准备,一直到现在才有初步的成果。中间遇到了非常多的困难,包括这个理念一开始出来,并没有得到很多人的接受,一度即使摆出实验结果证明方法的有效性,也很难去发表论文。当然,现在可以看到很多人慢慢开始接受概率与逻辑结合的观念。

另一个挑战与技术无关。李磊表示,在技术上的难度,研究人员都有各种方法去解决,但是研究人员通常还会碰到另外一个难题就是教育大众。不管是学术领域还是大众,认识上都存在很多盲区。今年AlphaGo在围棋上取得的成功,在很大程度上教育了大众,所以李磊认为AlphaGo的工作对所有研究人员而言大有裨益。

绝非取代人类,机器人是帮助人们提高效率

李磊同样指出了大家常常谈论的问题,即机器人会不会取代人类。他首先表示,写稿机器人的目的并不是取代记者,而是要去帮助内容创作者更高效地产出更有质量的内容。头条实验室在机器人方向上面投入了比较大的研发力量,希望达到协作人类高效工作的效果。而写稿机器人是其中表现最突出的。

写稿机器人项目最初是头条实验室和北大计算机系的团队分别独立研究,在今年7月20号,双方在一次学术交流中一拍即合,决定把各自的技术融合在一起,同时运用头条研发力量、运营力量可以快速地把这个技术形成产品,通过机器算法引擎推向用户。从7月20号开始合作,到8月6号就快速地上线并发出第一稿。其技术应用包括两个方面:一个是概率文法来生成,这个句子得有主语谓语宾语,看起来是一个通顺的句子;第二个方法是通过智能选取,把网上文字直播的精彩内容摘选出来融入到新闻当中。基于这两个技术并用做出了可写简讯和长文报道并智能配图的写稿机器人。

评论