返回 登录
0

【MDCC专访】刘少山:移动开发者需要对人工智能有好奇心和勇气

2016 年 9 月 23-24 日,由 CSDN 和创新工场联合主办的“MDCC 2016 移动开发者大会• 中国”(Mobile Developer Conference China)将在北京• 国家会议中心召开,来自iOS、Android、跨平台开发、产品设计、VR开发、移动直播、人工智能、物联网、硬件开发、信息无障碍10个领域的技术专家将分享他们在各自行业的真知灼见。

从8月8日起至9月4日,MDCC大会门票处于6.8折优惠票价阶段,五人以上团购更有特惠,限量供应(票务详情链接6.8折优惠,欲购从速!

当前人工智能的一个风口无疑是无人驾驶汽车,作为MDCC 2016人工智能与机器人专场的讲师,PerceptIn 联合创始人刘少山将会为与会开发者详细诠释无人驾驶技术。近日,刘少山接受CSDN的会前专访,分享了人工智能技术发展对移动开发带来的变化,以及机器人、无人驾驶汽车领域目前存在的一些问题,并展望了他对MDCC 2016的期待。

图片描述

PerceptIn联合创始人 刘少山

刘少山,PerceptIn联合创始人。加州大学欧文分校计算机博士,研究方向包括智能感知计算、系统软件、体系结构与异构计算 (FPGA、GPU)。 现在PerceptIn主要专注于增强现实、虚拟现实、机器人的核心SLAM技术以及其在智能硬件上的实现与优化。在创立PerceptIn之前在百度硅谷研发中心主要负责于百度无人车系统架构与产品化、大数据、深度学习以及异构计算平台的架构与开发。

以下为采访实录:

人工智能与移动开发

CSDN:谈谈您理解的人工智能,以及您关注的人工智能技术在工业界的一些应用方向。

刘少山:我是学系统出身的,那我就从系统的角度表达一下自己的想法。对我来说,在机器人场景中智能分为Perception,Insight,Intelligence三步。首先是机器人通过视觉语音等方式去了解这个世界,然后通过收集的大量数据来提取有用信息,最后从信息中提取并训练出智能。

在跟不少志同道合的朋友交流之后,我们都认为机器人首先会通过视觉与语音技术去感知这个世界,然后通过NLP技术去了解这个世界,并把学习到的知识建立为知识图谱,最后通过增强学习的方式去根据自身的知识与感知的信息去做决策。在无人驾驶的应用方面,其实视觉可以用于无人驾驶感知,语音与NLP可以用于人车交互,增强学习可以用于决策与控制。

CSDN:对于移动和嵌入式领域软硬件开发者来说,当前的人工智能热潮意味着什么?他们应该掌握哪些人工智能的技能来开发更好的应用?

刘少山:当前的人工智能热潮是一次大的技术革命,对广大技术人员来说是个特别好的机会,但是如果只掌握一个技术点是不足够的。根据我过去几年的经验,在技术行业隔行如隔山,比如做算法的对软件设计未必熟悉,专注做软件的很少懂系统,而懂系统的了解硬件的也不多。反过来也一样,让一个硬件工程师去写软件,他可能会觉得很难而不敢触碰。但是如果他能静下心来花点时间去学一下,其实这并没有想象中那么难。我在工作以及创业的过程中,发现能跨跃几个细分行业(比如软件、系统、硬件)的工程师非常难得也非常有价值。通常可以跨跃几个细分行业的人都比较有好奇心,也有勇气去尝试新的东西。我在百度美研时就有一个同事,有极强的好奇心与尝试的勇气,一年内把美研内部三个核心项目(异构计算、深度学习和知识图谱)都尝试了,而且都完成得很出色。在短短一年中,他已经融汇贯通,成为真正的全栈人才,也成为项目的核心人员了。

在人工智能热潮中,如果移动和嵌入式领域软硬件开发者可以多些好奇心与勇气,去尝试把一些开源的人工智能算法与系统移植到移动端,那么他既可以提高自身功力与价值,也可以通过移植的工作去了解一个新的方向,一举两得。比如MXNET是一个开源的深度学习平台,现在已经支持安卓,我们可以尝试在安卓上跑Inception-BN等不同的网络,也可以在平台上尝试深度学习加速与网络压缩等技术。其实移动端平台是很强大的,大家很多时候只用了部分的CPU,觉得计算能力很一般。我们公司使用了安卓手机的CPU、GPU、DSP等计算资源,把SLAM与深度学习系统成功整合到移动平台上,发现其实性能很不错,能耗也相当低。我甚至觉得如果把十几台手机拼起来,经过优化,是完全可以支撑无人驾驶的运算的——这有点极端,但我相信移动开发者可以容易地找到需要移动计算的场景,只是面临实现的挑战。

无人驾驶的挑战

CSDN:谈到无人驾驶,最近谷歌无人驾驶CTO离职,看来不是功成身退。您如何看待当前无人驾驶技术成熟度以及商业化的挑战?目前这个领域最需要的技术突破方向是哪些?

刘少山:无人车创业最重要是想清楚自己是想做乘着风飞的猪,期待在摔死前赚一笔,还是想长远发展,在拥有自己赖以生存的翅膀之后再去飞。现今,如果不计成本去做一台无人车,用最好的传感器、最好的算法以及最好的整合,那么这个无人车应该是可以做到安全可靠的,但是市场承受不了动辄几十万美金成本的无人车。所以要把无人驾驶技术变为产品,还需时日。

我认为无人驾驶技术会模块化,会出现分别专注于传感器、感知、决策以及高精地图的细分领域公司,然后还会出现专注于系统整合的公司为汽车商定制无人驾驶方案。现在大家都很关注传感器以及做感知技术的公司,但是忽略了在决策、高精地图,以及系统整合上其实有很大的机会。我们曾经与一个很大的汽车生产商聊过,发现他们根本就不在乎感知做得多好,因为不管感知能力多强大,感知技术公司现在没有方法去做行车时的实时决策,也没有高精地图,即使以上都有,他们也缺少有效的整合能力。

再这样发展下去,在无人驾驶市场车厂会比互联网公司有更大的优势。对车厂来说,这是个新的产品,他们可以逐步把成熟的技术加到车里,慢慢迭代。而对互联网公司来说,这是一个新的行业,技术并不是全部,还有各种他们不熟悉的因素,比如工业设计、汽车市场渠道、供应链和交通行业的规管等。

CSDN:您往返于硅谷和北京,看到国内外对无人驾驶的研发有哪些不同?国内有一些让您兴奋的创新?

刘少山:我每次回国都学习到很多。硅谷的团队一般有一定的技术优势,但是通病也是觉得自己的技术很牛,别人超越不了,有自视过高的问题。我在国内学习到两点很重要。

  • 第一点是厚积薄发。
    大家都知道,光学是无人驾驶传感器端一个核心的技术。在王阳明先生的故乡浙江余姚有一个企业叫舜宇,它在光学光电市场的占有率已经全球第一了,但是他们的口号是“坚定不移实施名配角战略”,注意是“配角”。一个市场占有率第一的企业以配角自居。我跟他们老总交流时说舜宇是个伟大的企业,他们老总却很谦虚地回应“我们远没到伟大”。从80年代起,他们一直专注光学,市场占有率是一点点地做上来的。在房地产最兴旺的时期,他们并没有转去利润更高的房地产业,而是继续专注光学实业,在当地招聘了1万多员工,支撑着1万多个家庭。他们很低调,专注做配角。大家都听过鼎鼎大名的Google Tango以及LeapMotion,但是谁知道Tango与LeapMotion的光学光电技术都是舜宇提供的呢?我特别佩服这种厚积薄发不浮躁的企业,在我看来他们是一个伟大的企业。

  • 第二点是技术并不是唯一。
    在深圳有个公司叫“易见联”,名字听上去特别“山寨”。我跟他们的郭总聊天,他说他跟打篮球的那位没关系,他们是做ADAS的,当时我觉得整个事情很逗。但是深聊之后,我发现郭总以前是做DVD的,在DVD没火起来的时候就进入了DVD市场了。接着,在智能手机爆发前夕他们就增加了智能手机业务。然后,在行车记录仪火起来了之前他们增添了行车记录仪业务。现在,顺着行车记录仪业务的发展,他们开发出ADAS产品线。听到这些,我特别佩服郭总,他们才是最前沿的人,站在了市场的最前线,有着敏锐的商业嗅觉与极强的生命力。他们的公司名与他们的公司一样,很接地气,很贴近市场。在市场这个事情上,他们是真正地厚积薄发。

所以,每次与舜宇、易见联这些企业的企业家聊天,我能学习与反思很多。

机器人核心技术创业

CSDN:您现在离开百度在机器人领域创业,能否介绍您的初衷?要实现什么目标?方便介绍目前进展?

刘少山:首先,我想先感谢一下百度美研的同事,在百度两年真的很开心,跟许多大牛学习到了很多,也结识了许多的挚友。我也想特别感谢一下我以前的上司James Peng,他给了我很多发挥的空间与机会。不夸张地说,百度美研是我工作过的最棒的地方。

关于创业这个事,我与好友张哲博士都很喜欢机器人,过去五六年一直都在关注机器人领域的发展,大家性格也很投缘,每周都聊,一直觉得要一起做点事情。聊的多了,在一个点上觉得差不多了,时机到了,就一起辞职创业了。

为什么觉得这个点到了呢?你看硅谷的发展,最早是从仙童半导体开始的,然后有了英特尔等芯片公司,把电脑越做越小,但是很难用。于是有了苹果与微软进行了一场技术革命,把电脑变得易用,从而个人电脑普及了。在个人电脑普及后,又一场技术革命是谷歌与百度等公司的出现把人与信息连接起来了。再有了人与信息的连接后,Facebook与微信等公司又把人与人连起来了,把人类社会搬到了互联网。在有了这样互联之后,Uber与Airbnb,包括更早的Amazon,又逐步把人类的商业模式互联网化了。到了今天,随着人类社会互联网化逐渐深入,以及人工智能的发展,我们认为机器人会逐渐代替人类去做一些服务类的工作,把人类从这些繁琐的工作中解放出来。所以我们决心出来创业。

说回技术,机器人研发很大的挑战来自于整合,与无人车相似,机器人并不是单一技术,是个计算的大集成,包括了传感器、计算平台、定位、地图、导航、避障和控制等等,如何把多个单点的技术很好地整合起来是一个很大的挑战。当前,我们公司首先专注的是机器人的核心SLAM定位技术以及这个技术在移动技术平台的整合与优化,我们的第一代产品很快会面世了。

在这里我要特别感谢一下张哲博士,我们创业初期遇到了很多很多的困难,有不少绝望时刻,但大家一直互相信任互相扶持,才走到今天,很不容易。前路肯定困难更多,但是我们坚信会成功走下去。

CSDN:基于什么理由选择从SLAM着手?

刘少山: SLAM是机器人的核心技术,是机器人的眼睛,我们首先要做好机器人的眼睛,让机器人可以动起来。然后会专注于利用人工智能技术去完善机器人的大脑,让机器人越来越智能。

多说一句,AR、VR与机器人的核心技术其实都是SLAM,有了SLAM后我们可以为VR游戏、AR应用以及机器人提供实时定位功能,因此可以说我们公司的目标并不局限于机器人。

CSDN:如您所说,创业的坑很多。创业之后,还会花多少时间在不太相干的无人驾驶技术方面?

刘少山:我会持续关注无人驾驶技术。我对这个技术的兴趣一直很浓厚,因为它并不是一个单一技术,而是一个众多技术的大整合,有挑战但前景无限。前面说过,这和机器人研发是相似的。关注无人驾驶,会让我们的视野更开阔,能够相互借鉴,使得我们的技术迭代更合理。

MDCC 2016前瞻

CSDN:谈谈您在MDCC分享的话题,将会让听众收获什么?

刘少山:这次主要想与大家系统地聊一下无人驾驶涉及的各项技术,包括无人驾驶传感器技术、无人驾驶操作系统、高精地图技术、决策与控制技术、无人驾驶安全、模拟与测试技术以及无人驾驶硬件平台。

对于无人驾驶技术链条上的开发者,希望可以帮助他们从全局的视角更深刻地理解开发需求和技术路径;非无人驾驶领域的移动开发者也可以得到借鉴,包括了解人工智能的技术版图和应用潜力,以及将人工智能技术引入现有系统/应用的可行步骤和注意事项。

同时,在这个专业的移动开发者技术盛会,我也希望听到更多关于人工智能、VR/AR开发等前沿技术的干货分享。

总之,期待届时能和大家多多交流。

2016 年 9 月 23-24 日,由 CSDN 和创新工场联合主办的“MDCC 2016 移动开发者大会• 中国”(Mobile Developer Conference China)将在北京• 国家会议中心召开,来自iOS、Android、跨平台开发、产品设计、VR开发、移动直播、人工智能、物联网、硬件开发、信息无障碍10个领域的技术专家将分享他们在各自行业的真知灼见。

从8月8日起至9月4日,MDCC大会门票处于6.8折优惠票价阶段,五人以上团购更有特惠,限量供应(票务详情链接6.8折优惠,欲购从速!

评论