返回 登录
12

【CSDN AI周刊】第12期 | Google收购Kaggle 滴滴在美成立研究院 两会人工智能火热


资讯


李飞飞Google Cloud Next 17演讲:收购Kaggle、发布一系列新API

李飞飞在妇女节这天完成了她加入谷歌云后的首秀——在谷歌 Cloud Next 17上发表主旨演讲。她在会上发布了谷歌云面向机器学习和人工智能的一系列新API 以及收购机器学习竞赛平台Kaggle的消息。主旨演讲中,她提到了自己加入谷歌云的初衷,强调了“AI 民主化”概念。

图片描述

买下 Kaggle,谷歌相当于买到了一个数据科学家的最大、最活跃的的社区,拥有了这样一个社区,谷歌也将在数据科学家中拥有更大的影响力。Kaggle 与谷歌有一些渊源,但只是最近的事情。本月初,谷歌和 Kaggle 联合举办了一项奖金总额10万美元的机器学习竞赛,竞赛内容是给 YouTube 视频分类。这场比赛也跟谷歌云平台进行了深度整合。

李飞飞还介绍了 Google Cloud 一些新 API ,比如 Video Intelligence API、Cloud Vision API、Cloud Natural Language API、Cloud Jobs API、Cloud ML Engine 等。

其中最重要的是 Video Intelligence API。 新推出的 API 能对视频进行全片分析,提炼全片的故事脉络,记录一共发生了多少个场景、每个具体场景的情节。这有助于对视频进行更精确的标签分类。

都是提人工智能,雷军与李彦宏的提案有什么不同?

李彦宏和雷军,一个政协委员,一个人大代表,在两会上各自的提案、议案中,都把人工智能摆放在了第一位。

图片描述

雷军的提案,分别是:一、加快实施人工智能国家战略;二、大力发展新零售激发实体经济新动能;三、推动中国科技企业出海。

其中在第一项议案“加快实施人工智能国家战略”中,雷军更具体地提出了五点建议,分别是:

  1. 在国家层面进行人工智能发展的顶层设计和专项规划;
  2. 加强人工智能基础理论研究;
  3. 加强人工智能科研人才、技术人才的培养与引进;
  4. 积极建立人工智能产学研协同创新共同体;
  5. 大力促进人工智能产业化发展。

图片描述

李彦宏的提案:

  1. 用人工智能技术来解决儿童走失的问题。利用百度的人工智能技术,就可以拿着特小的小孩照片来对比他/她现在长大以后是什么样子,这个技术可以应用到公安机关等相关的部门;

  2. 用人工智能技术调交通信号灯。根据百度做的技术,在百度周边后厂村这块儿做了一些实验。这个也涉及到百度过去几年的一项技术,就是识别汽车,现在这个技术我们在全球的比赛当中已经是第一位,准确率达到90%多;

  3. 人工智能和各个行业的结合。

通过对比,我们很容易看出,雷军的人工智能议案更宏观,上升到了国家战略层面,顶层设计、专项规划人才培养、基础理论研究等等,说明雷军对于人工智能的态度更加开放和具有前瞻性。

反观李彦宏的人工智能提案,更加具象,根据百度现有技术提出的解决某个具体行业、具体问题,无论是调度红绿灯来解决拥堵,还是解决儿童走失,看上去像是在推广百度的人工智能技术。

MIT新成果,用意念控制机器人

MIT的那款名叫Baxter的新机器人具备了新的“超能力”。最神奇的地方,就在于其完全可以根据探测到的人脑脑电图来审视自己的行为是否正确。

Baxter是由麻省理工学院的计算机科学与人工智能实验室(CSAIL)以及波士顿大学的人工智能团队联手开发的智能机器人。身体红灰相间,脸部就是一个显示屏的形状,上面还画着Q版的眼睛和眉毛,看上去很可爱!

图片描述

这个“帽子”可以监测到你脑部的脑电图(EEG),只要寻找到被称为“误差相关电位(ErrP)”的特定脑信号,Baxter就可以判断自己的行为是否正确,并及时作出纠正。

“误差相关电位(ErrP)”的特定脑信号是由人体在意识到某件事错误的时候自动生成的,但是由于ErrP信号十分微弱,因此,Baxter的系统会根据综合情况进行微调,以便接收信号并对其进行分类,从而作出判断。

此外,CSAIL开发的最新机器学习算法能够将Baxter识别脑电波的时间控制在10到30毫秒之间,从而实现人与机器之间实时的信息交换。

滴滴美国研究院落户硅谷,全球顶级安全专家加盟负责智驾安全

3月9日,滴滴出行正式宣布在美国加州硅谷山景城(Mountain View)成立滴滴美国研究院,重点发展大数据安全和智能驾驶两大核心领域。

据了解,美国研究院目前包括数十位数据工程师和研究人员,全球顶级安全专家查理-米勒(Charlie Miller)也于近期入职,负责智能驾驶安全项目。此前,Charlie Miller曾就职于苹果、Twitter、Uber等公司。

图片描述

据了解,滴滴美国研究院将以云安全、 深度学习、人机交互、计算机视觉及图像学、智能驾驶等领域的技术开发及应用为主要课题。美国研究院由滴滴研究院副院长弓峰敏领导。

滴滴出行创始人、董事长兼CEO程维表示,滴滴的国际化战略不仅着眼于为全球更广泛的社群提供便捷优质的出行服务,也包括构建高水准的跨境科研网络,促进全球创新资源的协同,引领全球交通领域的技术革新。

IBM语音识别错误率已降至5.5%

去年,IBM 已经在语音识别领域走到了一个新的里程碑:系统的错误率降低为 6.9%;而近日 IBM Watson 的语音识别系统将这个数字降到了 5.5%。虽然距人类平均水平5.1%还有一定差距但此时IBM Watson的语音识别能力已走在世界最前列。

IBM所使用的测试集为SWITCHBOARD,是已经沿用20年的难度较大的语料库,库中多为像 “买车” 这样的日常话题,是语音识别的 “试金石”。

IBM 研究院采用深度学习技术进行应用领域的拓展,结合了 LSTM 及三个 WaveNet 音频模型:

  • 前两个模型采用的是六层的双向 LSTM 模型:

    • 第一个模型有多个特征输入;

    • 第二个模型采用了说话者对抗的多任务学习;

  • 而第三个模型的特别之处在于,它不仅能够从积极的模型中学习,还能借鉴消极模型——这样一来,当相似的语音模式再次出现时,系统的表现会越来越好。

MILA 的 Yoshua Bengio 认可了 IBM 的这一工作,也表示语音识别领域的研究工作依然任重道远。

NVIDIA 发布 Jetson TX2 超级计算平台,目标瞄准终端人工智能

北京时间 3 月 8 日,人工智能计算公司 NVIDIA 宣布推出旗下嵌入式人工智能超级计算平台 Jetson 家族新一代产品 Jetson TX2,同时还带来了为 Jetson 平台提供支持的软件开发包的最新版本 JetPack 3.0。

新硬件 Jetson TX2 是嵌入式人工智能超级计算平台,可以在终端上部署人工智能计算能力,同时提供了 JetPack SDK 全套软件的支持。NVIDIA 此前已经发布了 Jetson TK1 以及 Jetson TX1 两款产品。

图片描述

据 NVIDIA 官方介绍,Jetson TX2 提供两种运行模态:一种是 MAX Q,能效比能达到最高,是上一代的 TX1 的 2 倍,功耗在 7.5W 以下;另一种是 MAX P,性能可以做到最高,能效比同样可以做到前一代的 2 倍,功耗则在 15W 以下。

而在软件开发包的更新方面,NVIDIA 推出 JetPack 3.0,此前该软件包已经有 2.1 和 2.3 版本。更新之后的软件 Stack 的具体架构如下:

图片描述

Ian Goodfellow 离开OpenAI,重回谷歌大脑团队

Ian Goodfellow 为 GANs 之父,是 Yoshua Bengio 的得意门生。他在去年的NIPS 2016上分享了生成式对抗网络(GANs)的研究成果,也就是用生成式模型(generative model)和判别式模型(discriminative model)进行对抗并实现机器学习训练的过程,目前已经成为机器学习一颗冉冉升起的新星。

图片描述

2013 年 6 月,还在蒙特利尔大学读博的 Ian Goodfellow 就以软件工程师的身份在谷歌的 Street Smart team 实习,并在毕业后先后担任谷歌 TensorFlow 及谷歌大脑团队的研究科学家。

2016 年 3 月,Ian GoodFellow 便从谷歌大脑团队投奔 OpenAI 麾下担任研究科学家。

而目前, Ian Goodfellow 的 LinkedIn 个人资料已经新增了一列,头衔为谷歌「Staff Research Scientist」。

其实这一事情早有端倪。前段时间,Ian Goodfellow 投递的论文获得了 ICLR 2017 的 Best Paper,而 Goodfellow 在此论文的公司名赫然写着 Google Brain。底部的注释显示,他这篇论文的工作是在 OpenAI 与 Google Brain 工作期间完成的。也就是说,Ian Goodfellow 很有可能在完成论文期间就从 OpenAI 跳回了谷歌。

声音识别的ImageNet诞生,谷歌发布大规模音频数据集

谷歌今天发布了一个在声音识别上对标图像识别领域中的ImageNet的大型数据库AudioSet。包含2100万标注视频、5800个小时的音频、527种类型的标注声音。

根据谷歌在官网的介绍,AudioSet 包括 632 个音频事件类的扩展类目和从YouTube视频绘制的 2,084,320 个人类标记的10秒声音剪辑的集合。类目被指定为事件类别的分层图,覆盖广泛的人类和动物声音,乐器和风格以及常见的日常环境声音。

发布者写道:通过发布AudioSet,我们希望为音频事件检测提供一个常见的,现实层面的评估,同时开始提供一个全面的声音事件词汇表。


学术


写给大家看的机器学习书【Part1】什么是机器学习?机器学到的到底是什么?

这个系列文章,作者将试着为开发工程师,产品经理、设计师、所有希望了解学习机器学习的人,介绍机器学习的原理、方法和实战技巧。

这是这个系列的第一篇,看完这篇您将知道

  • 什么是机器学习?
  • 机器学到的到底是什么?
  • 什么样的问题适合用机器学习来解决?

写给大家看的机器学习书【Part2】训练数据长什么样 机器学到的模型是什么

在这个系列的第二篇,我将首先借有好货这个真实的应用场景,让大家看看数据长什么样,了解现实中的机器学习输入数据是怎么来的。

接着,我们需要引出模型的的符号化表示和定义。数学符号的引入一方面有利于后续进入到具体的学习算法的讨论时有更高的效率,另一方面这也是每个学习者准确理解机器学习绕不过去的一环。

然后,在理解了输入数据,熟悉了模型的符号化表示后,我们将对之前讲到的相对粗略的机器学习流程做进一步的细化。

写给大家看的机器学习书【Part3】直观易懂的感知机学习算法PLA

前两篇我们已经学习了机器学习的概念和组成,这一篇,我们要具体地讲一个学习算法,把它用在有好货这个场景,看看这个算法到底是怎么样从用户日志中寻找规律,学得模型的。

这个学习算法的名字叫 PLA,全称 Perceptron Learning Algorithm。其中 Perceptron 译作感知机,它是人工神经网络中最基础的两层神经网络模型。学好Perceptron Learning Algorithm,你离入门人工神经网络也就不远啦。

【进阶】图解TensorFlow架构与设计

图片描述

本文将阐述TensorFlow的系统架构,帮助读者加深理解TensorFlow的工作机理。

本文假设读者已经了解TensorFlow的基本编程模型,包括计算图, OP, Tensor, Session等基本概念。

图片描述

如上图所示,本文重点关注系统中如下4个基本组件,它们是系统分布式运行机制的核心。

  • Client
  • Distributed Master
  • Worker Service
  • Kernel Implements

Jeff Dean 演讲直播:自主机器学习成为谷歌大脑最新研究热点

谷歌大脑负责人 Jeff Dean 在 UCSB 做了题为《通过大规模深度学习构建智能系统》的演讲。谈了谷歌大脑近来的工作进展,包括最新发布的 TensorFlow 1.0、将深度学习用于检测癌症,以及在自主机器学习方面的探索。在问答环节,Jeff Dean 对人工智能的未来表示乐观,说不认为 AI 的下一个冬天会到来。本文为图文直播整理。

图片描述

周志华:关于gcForest论文最新观点解答

上周,南京大学教授周志华的深度森林论文引发持续热议。本周,周志华在由人工智能学会举办的人工智能讲习班上接受专访,对深度森林做出解释。

周志华表示:“现在大家谈到深度学习就觉得它就等于深度神经网络。我们认为解决复杂问题把模型变深可能是有必要的,但是深度学习应该不只是深度神经网络,还可以有其他形式,与神经网络相比,其他形式也许有更好的性质。”

记者: gcForest 的参数少且结构灵活,发挥集成学习的特长。但gcForest如何在层数增长与问题复杂程度取得平衡?

周:我们认为现在这个工作是比较原创的,所以有很多方面需要探讨,它并不成熟,只是说这条路现在可以走。至于能走多远,还要看下面的探索。

记者:有知乎网友表示: “gcForest最让我吃惊的地方在于,仅仅是每层四个森林就能习得兼具accuracy和diversity的扩充特征。” 请问gcForest如何一边保证其accuracy的同时,还一边增加diversity的?

周:我们中间的一些设计是出于这样的考虑,例如引进完全随机树。现在文章里用四个森林,并不是说只能用四个。有更多资源以后就可以探索使用更多更大的森林会怎么样,只不过我们现在承担不起那个资源量。


实践


通过机器学习刺激销量——如何利用NLP挖掘潜在客户

在这篇博客中,作者会向大家介绍如何以更有效的方式通过 Xeneta 进行营销,会训练一个机器学习算法,通过对于公司的描述来预测潜在客户的质量。

深度学习股市掘金

近年来在图像和语音识别等领域,深度学习技术所取得的突破引起了很大关注。目前在金融领域,深度学习的应用也越来越广泛。那么,深度学习可否应用到股市呢?又会给股民们带来怎样的福利呢?本文将告诉你如何利用深度学习在股市掘金。

人工智能走进重症监护室:可预测病人死亡,准确率达93%

医院对于自家的重症监护室(ICU),往往有一个不成文的期望:减少“在病床上去世”事件的发生。这种想法乍一听有点奇怪,但可以理解。

这个期望可能很快就能实现了。基于监测患者生命体征各种设备所提供的实时数据,ICU似乎是人工智能工具的完美使用场景,可以用来判断患者的实时病情以及病情何时可能恶化。


线上课程


使用TensorFlow创建可自动玩游戏的DQN模型

时间: 2017.03.16 20:00 - 21:00

主讲人:黄文坚

《TensorFlow实战》作者,本书获得Google TensorFlow工程研发总监Rajat、360首席科学家颜水成的推荐。PPmoney大数据算法总监,负责集团的风控、理财、互联网证券等业务的数据挖掘工作。Google TensorFlow Contributor。前明略数据技术合伙人。曾就职于阿里巴巴搜索引擎算法团队,负责天猫个性化搜索系统。曾参加阿里巴巴大数据推荐算法大赛,于7000多只队伍中获得前10名。本科、研究生就读于香港科技大学,在顶级会议和期刊SIGMOBILE MobiCom、IEEE Transactions on Image Processing发表论文。

主题说明:

深度强化学习(DQN)是人工智能领域最热门的方向之一,吸引众多AI领域的优秀科学家去发掘,其通用性在各领域备推崇,本次课程集中讲解DQN及其TensorFlow的实现。

适合对象:

对深度学习、强化学习、TensorFlow其中之一感兴趣的人士。

扫码报名:

图片描述

解密Google Tango,从视觉惯性里程计到机器人SLAM

时间: 2017.03.23 20:00 - 21:00

主讲人:

陈子冲,赛格威机器人高级架构师和算法负责人。本科毕业于清华大学电子工程系,完成基于DSP的卫星信标机的全套软硬件实现,获本科生校级优秀论文。后在瑞士联邦理工大学深造获得博士学位,其博士课题获得国家优秀自费留学生奖。归国后,加入华为媒体实验室,带领团队成功研发应用于华为手机的实时双目视觉算法。2015年,陈子冲加入赛格威机器人团队,致力于机器人导航等视觉感知算法的研发。

主题说明:

学员对视觉SLAM有一定了解,通过课程可以深入了解最尖端的视觉惯性里程计 – Google Tango的内部原理和局限性。随后介绍该技术在学术界的发展态势,以及过渡到机器人SLAM技术的挑战。

适合对象:

对于视觉SLAM,机器人导航,或VR 6DOF跟踪技术有一定了解或者有兴趣的学生,工程师等。

扫码报名:

图片描述


图片描述

图片描述

评论