返回 登录
9

【CSDN AI周刊】第13期 |315曝人脸识别漏洞 马云启动NASA计划 AI或将毁灭人类

资讯

马云启动“NASA”计划 为未来20年愿景研发核心科技

2017年3月9日,阿里巴巴集团在杭州召开首届技术大会,会议透露,阿里巴巴正在启动一项代号“NASA”的计划,面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技。

图片描述

阿里巴巴未来20年的愿景是构建世界第五大经济体,服务全球20亿消费者,创造1亿就业机会,帮助1000万家企业盈利。

马云进一步阐释:“一个服务20亿人的经济体,需要强大的技术实力。我们将建立阿里巴巴的’NASA’,以担当未来的责任。面向机器学习、芯片、IoT、操作系统、生物识别这些核心技术,我们将组建崭新的团队,建立新的机制和方法,全力以赴。以前我们的技术跟着业务走,是‘兵工厂模式’,但手榴弹造得再好,也造不出导弹来。阿里巴巴必须思考建立导弹的机制,成立新技术研发体系,聚焦核心领域的研究。这些研究的目标是为了解决10年、20年后的困难。”

人脸识别315躺枪,支付宝、商汤、云从等回应

2017年的“315”落下帷幕,人脸识别技术公司纷纷躺枪。16日一大早,大家纷纷发表声明,表示自家的人脸识别技术还是相当安全的。

晚会现场,主持人现场演示了攻破人脸识别手段。在演示过程中,一张他人的静态自拍照,通过技术处理,可以变成能眨眼睛、能微笑的“伪活人”。甚至还可以利用这张自拍照,借助3D建模技术,让自己“变脸”成另一个人,轻易骗过登录系统,成功“黑”进对方账号。

百度在节目播出后5分钟内立刻作出回应——邀请百度深度学习实验室主任林元庆,在百度科技园的人脸识别闸机做一次亲身验证,看百度人脸识别系统究竟能否被一段视频“骗过”。阿里巴巴的支付宝也很快作出回应:“你们都觉得我躺枪了吗?”

3月16日早,我们看到国内众多人脸识别创业公司的回应,包括云从科技、商汤科技等。

霍金:人工智能等技术的发展或许将毁灭人类

北京时间3月15日消息,据国外媒体报道,斯蒂芬·霍金近日警告称,技术的发展需要得到控制,以阻止其毁灭人类。在此之前,这位世界知名的物理学家就曾警告过人工智能的危险。他认为,人类必须找到一种方法,在重大破坏造成之前迅速发现所面临的威胁。

图片描述

“从文明开始之时,侵略就一直是很有用处,因为它有着绝对的生存优势,”霍金说,“通过达尔文式的演化过程,侵略性深深根植于我们的基因之中。然而,如今的技术发展已经加快到了某种程度,使这种侵略性可能会以核战争或生物战争的形式毁灭人类。我们需要用逻辑和理性来控制这种与生俱来的本能。”

不过,霍金也表示,尽管人类面临着各种各样的问题,但依然有希望存活下去,而这需要我们所有人都一起努力。“我们需要更快地认识这些威胁,并在它们失去控制之前采取行动。这可能意味着需要建立某种形式的世界政府,”霍金说道。

软银在美国第一笔人工智能风投给了这家公司

今年年初的报道显示,三星计划投入10亿美元成立专项基金收购人工智能公司。该战略已经付诸实施,三星斥资超过两亿美元收购了人工智能创业公司Viv;未来这家创业公司的产品将嵌入三星的智能手机之中。

而去年斥资320亿美元收购移动芯片设计商ARM的日本科技巨头软银,也正在人工智能领域积极布局。软银创始人孙正义在今年巴塞罗那移动通信大会MWC上预计,30年内机器人的数量就将超过人类,并会拥有超级智力。

图片描述

搭载ObEN技术的酒店机器人Ben

加州人工智能创业公司ObEN正是在这样的整体思路下成为软银投资的第一家人工智能创业公司的。准确的说,投资ObEN的是软银刚刚创办的旗下唯一一家专注早期投资、专注人工智能领域的风投基金SB Next Media Innovation Fund,而ObEN则是该基金的第一个投资项目。

谷歌旗下公司帮AI打通任督二脉:能同时学玩10款游戏

3月14日,谷歌公司旗下的人工智能公司DeepMind发布研究论文,称其攻破了人工智能(AI)底层记忆技术上的难题,或将能够训练AI系统完成多种任务,而不像现在仅具备单项技能。

DeepMind在《美国国家科学院学报》(PNAS)上发表了题为《克服神经网络中的灾难性遗忘》(Overcoming Catastrophic Forgetting in Neural Networks)的论文,称研究人员利用监督学习和强化学习,克服了AI研究中神经网络“灾难性遗忘”的问题,以拓宽AI系统的应用面。也就是说,将来的AI可能不再被用作某一项特定用途,而是能够在不同任务之间切换,实现序列学习(Sequences Learning)。

图片描述

DeepMind的EWC算法帮助有序训练神经网络

“灾难性遗忘”是认知科学中的术语,在深度神经网络设计里,每一次被提供新的数据时,它就会自动覆盖前一个任务学习到的知识,这是AI技术中的致命缺陷。

该论文在描述其研究意义时写道:“深度神经网络是当前解决一系列难题(包括语言翻译、图片分类、图像生成)最成功的机器学习技术。但是,该技术不能像人类一样有序地进行多任务学习。在本次研究中,我们提出了一项可行的解决方法,即通过计算已经学习到的知识的重要性权重比例,并加以保护,以达到有序训练。”该研究的灵感来自神经科学的突触整合,促使多学科的再强化学习问题有序进行。

目前,AI技术还只能针对特定行业或项目运作,例如用于金融服务、法律服务、围棋比赛等,它们都是独立分开的系统。一旦DeepMind的研究实现应用,AI就能实现跨行业、跨项目的应用,大大提升AI系统的连接和服务面。

英特尔加码智能驾驶 巨头抢滩车联网

未来,汽车将会和手机一样成为互联网新入口,其将会整合各种服务和功能。除了半导体公司,目前包括谷歌在内的互联网巨头以及特斯拉、宝马等汽车巨头,还有大量的创业公司都加入了智能驾驶大风口的角逐。可以看到,一年一度的CES和MWC上,车联网也成为了绝对的主角之一。

人工智能的发展正加速智能驾驶时代的到来,移动互联网时代失势的英特尔也不遗余力地布局未来,以重新获得主导权——3月13日晚间,英特尔宣布153亿美元溢价近50%收购以色列ADAS(高级驾驶辅助系统)厂商Mobileye。

业内人士分析认为,自动驾驶目前成为市场潮流,IT企业正纷纷从自身擅长的地方向汽车领域扩展。Intel是芯片制造商,Mobileye则是把应用软件固化在芯片上,两者的业务关系密切,进行垂直整合能够增加附加值。对于英特尔来说,可以从汽车的二级供应商成为一级供应商,离利润中心更近。换言之,借助Mobileye的行业积累,英特尔能够快速嵌入最大的客户群体整车企业,在行业快速占据一个比较重要的地位。

百度推出 AI 语音转录软件 SwiftScribe

百度深度学习研究院推出百度第一个 AI 驱动的转录软件 SwiftScribe 的 beta 版。SwiftScribe 的核心技术是百度的语音识别引擎 Deep Speech 2。它的神经网络使用数千小时的有标注语音数据训练,学习将声音与特定的词汇和短语对应起来。除了先进的 ASR 技术,百度还设计了一个直观的快捷键和创新的人机交互系统,以解决不连续的问题,这是用户在转录时的最大障碍之一。

百度 SVAIL 开发了 SwiftScribe 的各个组件,包括语音识别系统和用户界面。这种方法的一个很大的有点是,当用户在使用 SwiftScribe 进行转录和编辑时,系统同时也在学习和提升。正是这种精细的端到端的方法,使 SwiftScribe 不同于市场上其他同类产品。

学术

无人驾驶硬件平台

本文是无人驾驶技术系列的第十篇,是这一系列目前为止阐述最全面的一篇。着重介绍无人驾驶硬件平台设计。无人驾驶硬件系统是多种技术、多个模块的集成,主要包括:传感器平台、计算平台、以及控制平台。本文将详细介绍这三个平台以及现有的解决方案。希望本文对无人驾驶从业者以及爱好者选择硬件的时候有帮助。

作者唐洁,华南理工大学计算机科学与工程学院副教授;刘少山,PerceptIn联合创始人。加州大学欧文分校计算机博士,

Google Brain对NMT训练成本过高的几点发现

在过去几年里,基于神经机器翻译(NMT)技术的产品系统被越来越多部署在终端客户端中,NMT本身也因此获得了巨大进步。但目前,NMT构架还存在着一个很大的缺点,即训练它们的成本太高,尤其是GPU的收敛时间,有时会达到几天到数周不等。这就使得穷举超参数搜索(exhaustive hyperparameter search)的成本和其他常见神经网络结构一样,让人望而却步。

为此,Google Brain首次对 NMT 架构的超参数进行了大规模分析,报告了数百次实验测试的经验结果和方差数(variance numbers),这相当于在标准WMT英译德任务上运行超过250,000 GPU小时数的效果。从实验结果中,提出了有关建立和扩展NMT构架的创新观点,也提供了一些实用建议。

  • 使用 2048 维的大型嵌入(embeddings)有最优实验结果,不过优势不大;仅有 128维的小型嵌入似乎也有足够的能力去捕捉绝大多数必要的语义信息。
  • LSTM Cell 始终比 GRU Cell表现得好。
  • 2-4
    层的双向编码器性能最佳。更深层的编码器在训练中不如2-4层的稳定,这一点表现得很明显。不过,如果能接受高质量得优化,更深层的编码器也很有潜力。
  • 深度 4 层解码器略优于较浅层的解码器。残差连接在训练 8 层的解码器时不可或缺,而且,密集的残差连接能使鲁棒性有额外增加。
  • 把额外的关注度参数化(Parameterized additive attention),会产生总体最优结果。
  • 有一个调适良好、具有长度罚分(length penalty)的集束搜索(beam
    search)很关键。5-10集束宽度搭配1.0长度罚分的工作效果好像不错。

写给大家看的机器学习书【Part4】—— 机器学习为什么是可行的(上)

这个系列文章,我将试着为开发工程师,产品经理、设计师、所有希望了解学习机器学习的人,介绍机器学习的原理、方法和实战技巧。

往期文章请见:【Part1】什么是机器学习?机器学到的到底是什么?【Part2】训练数据长什么样?机器学到的模型是什么?【Part3】直观易懂的感知机学习算法PLA

在本篇中,我们将具体辨析一个问题:用历史数据训练的模型能够预测未来吗?或者更直白一点,你敢用机器学习模型真金白银地进行股票交易吗?

李理:递归神经网络RNN扼要

本系列文章面向深度学习研发者,系统讲解了深度学习的基本知识及实践,以Image Caption Generation为切入点,逐步介绍自动梯度求解、卷积神经网络(CNN)、递归神经网络(RNN)等知识点。本文为第14篇,RNN系列第1篇。

前面我们介绍了CNN,这对于Image Caption来说是基础的特征提取部分,或者说是对图像的“理解”部分,而接下来需要用一句话来“描述”图像的内容,这就要借助RNN了。

RNN的特点是利用序列的信息。之前我们介绍的神经网络假设所有的输入是相互独立的。但是对于许多任务来说这不是一个好的假设。如果你想预测一个句子的下一个词,知道之前的词是有帮助的。RNN被成为递归的(recurrent)原因就是它会对一个序列的每一个元素执行同样的操作,并且之后的输出依赖于之前的计算。

实战

如何让人工智能学会用数据说话

美联社机器人撰写财经报道,微软机器人自动生成对联,谷歌机器人自动写诗,一时间,机器人自动写作成为学术界和产业界关注和讨论的热门话题。

机器人写作又称文本生成。从广义上讲,一些传统的自然语言处理任务,例如机器翻译、文本摘要、对联生成、诗词生成等都属于文本生成的范畴。这些任务的共同点是用户输入非结构化的文本,机器根据任务目标输出相应的文本。

不同于这些任务,本文主要与大家分享的是基于结构化数据的文本生成,即用户输入结构化的数据,机器输出描述和解释结构化数据的文本。该任务的特点是基于数据和事实说话。

计算机告诉你,唐朝诗人之间的关系到底是什么样的?

在我还念中学的时候,每当心情不好,就靠读诗词来排遣,慢慢读得多了,就发现唐朝诗人之间存在着微妙的关系。比如杜甫非常喜欢李白,到了做梦都想见李白的地步:三夜频梦君,情亲见君意(梦李白)。而李白向孟浩然表过白:吾爱孟夫子,风流天下闻(赠孟浩然)。孟浩然的好基友则是王昌龄:数年同笔砚,兹夕间衾裯(送王昌龄之岭南)。

出于好奇心,我一度想理清楚他们之间的关系。但是全唐诗一共四万多首,再加上诗人之间经常称呼对方的别称,整理起来非常麻烦,慢慢的也就绝了这个念头。

清华大学自动化系张长水教授:神经网络模型的结构优化

当前,深度神经网络模型的出现给我们带成了很大的影响,这个影响大部分都是积极正面的,但是同时也存在一些不同看法。不管怎么说,深度学习模型在传统的很多机器学习问题和相关问题上,都取得了令人瞩目的突破和进展。

我举几个例子,比如图像识别。图像识别是这样一个问题:有一张图像,需要识别这个图像是猫、是狗、是计算机、是羽毛球拍?在2012年的深度学习网络用于解决问题时,有了很大的突破。

除此之外还有其他的问题,比如图像描述、机器翻译、语音识别。机器翻译我们知道过去几十年发展也很慢,基本上没有办法应用实际,也是因为深度学习方法的应用,使得机器翻译有了一个很大的突破。

深度学习方法应用有很多好处,同时也有很多问题。比如说,深度学习网络模型计算量特别大、模型特别复杂。模型复杂导致两个问题,第一是训练上的困难,第二个是测试上的困难。

线上课程

解密Google Tango,从视觉惯性里程计到机器人SLAM

时间: 2017.03.23 20:00 - 21:00

主讲人:

陈子冲,赛格威机器人高级架构师和算法负责人。本科毕业于清华大学电子工程系,完成基于DSP的卫星信标机的全套软硬件实现,获本科生校级优秀论文。后在瑞士联邦理工大学深造获得博士学位,其博士课题获得国家优秀自费留学生奖。归国后,加入华为媒体实验室,带领团队成功研发应用于华为手机的实时双目视觉算法。2015年,陈子冲加入赛格威机器人团队,致力于机器人导航等视觉感知算法的研发。

主题说明:

学员对视觉SLAM有一定了解,通过课程可以深入了解最尖端的视觉惯性里程计 – Google Tango的内部原理和局限性。随后介绍该技术在学术界的发展态势,以及过渡到机器人SLAM技术的挑战。

适合对象:

对于视觉SLAM,机器人导航,或VR 6DOF跟踪技术有一定了解或者有兴趣的学生,工程师等。

扫码报名:

图片描述


图片描述 图片描述

评论