返回 登录
0

【CCAI 2016专访】林德康:Google那样的人工智能公司,中国可以有

8月26日至27日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会发起主办、中科院自动化研究所与CSDN共同承办的2016中国人工智能大会(CCAI 2016)在北京辽宁大厦盛大召开,这也是本年度国内人工智能领域规模最大、规格最高的学术和技术盛会,对于我国人工智能领域的研究及应用发展有着极大的推进作用。大会由CSDN网站进行专题直播,并由百度开放云提供独家视频直播技术支持。

大会邀请了40多位全球顶级人工智能专家共论前沿/热门技术与产业实践。Singulariti.io公司联合创始人、ACL Fellow林德康博士也受邀参加本次大会,发表了题为《从搜索引擎到问答引擎再到动作引擎》的主题报告,并在大会期间接受CSDN记者专访,就人工智能、自然语言处理(NLP)技术进展和创业实践进行了更深入的讨论。

林德康认为,全球的人工智能都还处在初级的阶段,但就目前而言,NLP、语音识别等基础技术已经有足够的成熟度,可以支持很多创新性的应用,但这正是目前所缺乏的。作为一名兼具多年大学教授和Google研究院眼里的从业者,他也对到工程方面的重要性深有体会,譬如借助数据和计算可以较为轻松地实现算法精度的提升。

图片描述

Singulariti.io公司联合创始人、ACL Fellow林德康博士

林德康,语音助手初创公司Singulariti.io联合创始人和联席CEO。前Google高级管理科学家,曾领导一个研究与工程团队,开发出一款基于谷歌搜索结果的自动问答产品。加入谷歌前担任Alberta大学正教授。发表学术论文90多篇,总引用数超过12000次。2012年被选为国际计算语言协会(ACL)Fellow。

人工智能技术进展

在今年的AlphaGo对战李世石之后,整个市面上的人工智能特别火,而林德康表示:人工智能在各个国家都是属于一个初始阶段,现在好多新的技术,都在颠覆过去的经验。

林德康对NLP以及语音识别领域的进展及其带来的机遇印象深刻:

  • NLP最近几年进展很快。现在的很多基础技术,比如词性标注、语法分析、中文分词等,无论从效率和准确度来说都已达到可用的级别。现在的主要问题是怎么能够把这些语言分析的技术整合到实际的应用中去。不同的应用有不同的做法,创业公司可以根据自己的应用领域,把这些技术链条完善。

  • 语音识别技术有了很大的飞跃,包括中文识别率在深度学习的推动以及科大讯飞等中国团队的努力之下已达到可用的精度。林德康举例说,他以前敲中文非常慢,所以哪怕和中国人线上交流的时候,一般也都是用英文写(知道交流对象懂英文),后来开始用语音输入,发现效率特别高,所以现在和华语交流对象在线交流时,主要是使用语音输入法输入。

Google的启示

自清华大学毕业后,林德康就到加拿大攻读硕士,并于博士毕业后在Manitoba和Alberta大学任教12年,做到了正教授,然后在2004年的时候林德康加盟Google研究院。

离开学校到Google,林德康初期的工作也是偏向于NLP领域的研究,但一个很大的区别,就是Google的数据资源和计算资源是学校没法比的。而有了数据和计算,很多问题其实就可以用简单的办法解决,只要能够处理这些大数据,机器学习算法的准确度就能够随着数据量的增长而提升。所以,可以处理更多的数据,这才是算法最关键的问题。这是原来在学校里感受不到的。

林德康在Google的后半段工作,是研发一个自动问答系统——当有用户在Google搜索一些具体的问题时,即可找到对应的具体答案。例如:

Q:北京的年降雨量是多少?
A:60mm。

这样的回答结果,是基于Google PageRank算法排序靠前的文章,从中提炼中正确的最终答案。这在当时Google内部也是一个大项目。林德康表示,这个系统作为一个产品上线,研发过程中也需要很多产品相关的知识,所以Google的工作经历,也教会了他如何把人工智能技术打造成一个更好的产品

Singulariti.io创业实践

为什么会离开Google这个世界级公司去创业?林德康介绍了两个契机:

  1. 在做问答系统的时候,做了很多自然语言的研究,希望把系统做的很鲁棒——不管用户怎么问,不管搜索到的文章怎么说,系统都能找到正确答案。后来他和他的合伙人意识到,这些技术用到语音助手里头都非常好。
  2. 语音输入可靠性提高以后,能做的事情就非常多。科大讯飞虽然已经把语音变成文字,但是从文字到语意(拿到这个文字以后怎么去做具体的事情),还没不像语音识别那样有大的突破,但他们在这方面有很多的积累。

于是,林德康“super excited”地从Google离职,回国创立了Singulariti.io团队,致力于语音助手产品研发。不过,苹果Siri、微软Cortana和Google Now目前也都在做同样的事情,Singulariti.io和他们有什么不同?

林德康表示,三巨头的技术,主要是针对操作系统现有功能而研发,比如打开无线网络、设定闹钟等,当然Siri还有一些逗乐的对话的特性。而Singulariti.io的语音助手没有在OS上做文章,相反地,它是直接和手机App对接的,比如微信、携程、美团、饿了吗等。林德康表示,技术成熟以后,用户只要对着手机说出自己的需求,即可由语音助手帮助去实现语音自动预定,如语音预定酒店、午餐等。

我们要做到能够很容易地对接上每一个App,能够把用户说的话,翻译成App里头的操作动作,用户说完话以后,就通过这个翻译过去的动作来完成他想做的事情。

这个产品目前已经有应用雏形,林德康预计今年可以上线这个应用。他还表示,Singulariti.io在今年的5月份已拿到了A轮的融资,对于下一步产品的良性运营起到了非常大的帮助。

中外人工智能差距

在人工智能尤其是机器学习领域,包括开源社区,在林德康之外,华裔的身影并不罕见,譬如斯坦福大学的李飞飞,CMU的邢波,百度的吴恩达,微软的邓力,贾扬清等开发的Caffe,李沐、陈天奇等开发的Mxnet,俞栋等开发的CNTK,以及张伟德、刘少山等开发的Paddle,有影响的人物和算法库随处可见。

然而,我们也可以容易地看到,这些华裔长期生活在国外,那么中国本土和国外的人工智能技术差距如何呢?对此,林德康表示:

  1. 从某种意义上来讲,中国的工作并没有比欧美的时间晚多少,在这个颠覆性阶段,大家实际上都离起跑线都不太远,这是一个很好的事情;
  2. 仅从个人创业经验来看,目前Singularit.io公司就拥有很多聪明的年轻人,这个差距是挺容易赶上的;
  3. 当下信息共享速度非常之快,不仅前沿的研究成果很快能在arXiv找到,而且还有TensorFlow等开源平台让中国的年轻人开源试验,这也为中国人工智能进一步的发展打下了很好的基础。

而对于“中国能否诞生一家类似于Google的世界级人工智能巨头”的问题,林德康给出了肯定的回答:“会啊。比如说以前谁也没有想到阿里巴巴会有今天这么大的体量,其实阿里巴巴跟Google也是一个量级的互联网公司。”

在他看来,中国人工智能技术人员、人工智能企业的发展,需要足够的交流、讨论,而CCAI这样的大会,既邀请到了海内外的顶级专家来解读前沿研究,也邀请业界技术大牛,包括来自创业公司的大牛来共同探讨实践经验,这无论是对于国内人工智能的研究水准和还是对于应用落地,都会有很好的推动作用。预计在整个产业的共同推动之下,人工智能将会给人民的生活带来很多的变化。

评论