返回 登录
23

【AI每日播报】两会代表呼吁 尽快落实人工智能国家战略

欢迎人工智能相关的技术投稿、约稿、行业分析、热点新闻、编译等,请发送邮件至baiyan@csdn.net,期待大家投稿。

【在线直播课】《TensorFlow实战》作者、PPmoney大数据算法总监黄文坚老师即将开课:《使用TensorFlow创建可自动玩游戏的DQN模型》,本次课程集中讲解Deep-Q Network及其TensorFlow的实现。点击报名

资讯

两会代表呼吁 尽快落实人工智能国家战略

“人工智能”概念爆发,除了首次写入政府工作报告之外,马化腾、雷军、李彦宏等两会代表、委员也对此展开广泛讨论,其中包括建议大力实施人工智能国家战略,制定相应的产业政策,加大人工智能与各行业各场景的融合应用等。在不少中国企业家看来,人工智能寄托着中国抓住高科技“产业链话语权”、与国外巨头齐头并进的愿望。

小米雷军:建议国家大力实施人工智能国家战略

全国人大代表、小米科技董事长兼CEO雷军认为,人工智能技术的重大突破必将带来新一轮科技革命和产业革命,对人类生活的方方面面将产生深远的影响。大力发展人工智能技术是我国经济转型升级的重要动力。

雷军认为,目前我国人工智能的发展也遇到一些问题,比如体制机制的束缚、缺乏国家级专项规划、人才匮乏、核心技术及核心元器件仍受制于人、政府大数据开放力度不够等等。他建议国家大力实施人工智能国家战略,在原有政策的基础上采取更加有力的措施促进人工智能大发展,具体包括:在国家层面进行人工智能发展的顶层设计与专项规划,加强人工智能基础理论研究和核心技术突破,加强人工智能科研人才、技术人才的培养与引进,积极建立人工智能产学研协同创新共同体,大力促进人工智能产业化发展等五方面。

百度李彦宏:建议制定国家层面的总体行动计划推进“智能+经济”发展

全国政协委员、百度董事长兼CEO李彦宏也建议制定国家层面的总体行动计划,大力推进“智能+经济”的发展,从观念引导、制度创新、数据开放和专项支持等方面,为人工智能行业应用构建良好的政策环境。具体建议包括:加强观念引导,增进行业和公众对人工智能产业价值的认知,使其积极拥抱人工智能;破除人工智能行业应用的体制机制障碍;加强行业数据的开放和共享;鼓励人工智能企业与各行业的创新合作,培育一批市场竞争力强、国际影响力大的人工智能企业。

腾讯马化腾:成立了AI Lab推动人工智能与产品结合

另外,腾讯也已经成立了AI Lab,其官网解释是“专注机器学习、计算机视觉、语音识别、自然语言处理等人工智能领域的研究”。今年2月,原百度研究院副院长张潼,出任AI Lab执行主任,主持AI相关工作。据马化腾透露,除了AI Lab,腾讯各个事业部门(BG)也均下设AI团队。此外还有香港的What Lab(微信-香港科技大学人工智能联合实验室)、上海和合肥的优图实验室、北京的微信模式识别中心等。2月14日,腾讯QQ空间携手电商平台唯品会举办了首个“AI+时尚”大秀,探索AI大数据在电商领域的应用。

初学

人人都可以做深度学习应用:入门篇

2017年围棋界发生了一件比较重要事,Master(Alphago)以60连胜横扫天下,击败各路世界冠军,人工智能以气势如虹的姿态出现在我们人类的面前。围棋曾经一度被称为“人类智慧的堡垒”,如今,这座堡垒也随之成为过去。从2016年三月份AlphaGo击败李世石开始,AI全面进入我们大众的视野,对于它的讨论变得更为火热起来,整个业界普遍认为,它很可能带来下一次科技革命,并且,在未来可预见的10多年里,深刻得改变我们的生活。

其实,AI除了可以做我们熟知的人脸、语音等识别之外,它可以做蛮多有趣的事情。

例如,让AI学习大量古诗之后写古诗,并且可以写出质量非常不错的古诗。

又或者,将两部设计造型不同的汽车进行融合,形成全新一种设计风格的新汽车造型。

还有,之前大家在朋友圈里可能看过的,将相片转换成对应的艺术风格的画作。

因此,从两方面来了解深度学习:深度学习技术与深度学习环境搭建。

深度学习技术

  • 人的智能和神经元
  • 人工神经元和神经网络
  • 深度学习模型的训练方式

深度学习环境搭建

  • 学习的提前准备
  • Google的TensorFlow开源深度学习框架
  • TensorFlow环境搭建

让亿万白领失业的“超脑” 解密IBM沃森前世今生

现今的人工智能能干嘛?人们接触得最多的,是聊天机器人。对行业稍有关心的,会关注到火热的自动驾驶以及和图像识别、语音识别相关的领域。媒体们纷纷唱衰司机,认为这会是在人工智能冲击下第一个消失的职业。

然而尽管人们在有意无意地回避着,许多从事脑力工作的白领们面对的境遇一点不比司机们轻松——目前尚没有司机因为人工智能而失业,倒是有白领因为AI的崛起先丢了工作。

IBM的沃森就是其中一个“罪魁祸首”。当谷歌在全力开发无人驾驶解放司机时,IBM蓝色巨人正在通过其认知平台“沃森”,借人工智能之力实现自身向“认知计算”的转型。沃森本身,则因为渗透进了各个脑力劳动行业,对白领们的工作产生了巨大的威胁。

从1997年的深蓝到如今的沃森,已经过去20年。20年后,IBM在后起之秀的挑战下,早已丢掉了IT老大的宝座,转而向人工智能寻求复兴。按照沃森整合各项能力的速度,未来它将变成一个超脑般的存在,接收人们给出的各种难题,然后给出解决方案。有了这样强大的人工智能系统,许多工作将不再需要人类的参与,至少是非创造性的脑力劳动将由沃森代劳。

作为沃森们兴起的负效应,曾经看起来完全不会被机器人所替代的白领们,正在祈求自己的工作不要被人工智能盯上。

世界每天都在发生变化,时代的浪潮翻涌着,无论是庞大的IBM,还是微渺的个人,都不能脱离历史的行程独善其身,抱残守缺者终将落后。

进阶

Jeff Dean 演讲直播:自主机器学习成为谷歌大脑最新研究热点(PPT)

谷歌大脑负责人 Jeff Dean 今天上午在 UCSB 做了题为《通过大规模深度学习构建智能系统》的演讲。Jeff Dean 谈了谷歌大脑近来的工作进展,包括最新发布的 TensorFlow 1.0、将深度学习用于检测癌症,以及在自主机器学习方面的探索。在问答环节,Jeff Dean 对人工智能的未来表示乐观,说不认为 AI 的下一个冬天会到来。

Jeff Dean分别从三个观点进行阐述:

  • 深度学习在谷歌:超越人类水平
  • 用超强大的计算力,让机器学习算法不再成为问题
  • 自主机器学习,让机器学会学习

通过文字描述来生成二次元妹子?聊聊conditional GAN与 txt2img模型

前些日子在Qiita上看到了一篇神奇的帖子:Girl Friend Factory 機械学習で彼女を創る Qiita。帖子里面提到利用GAN,通过文字描述来生成二次元图像。这篇文章的作者还把他的想法搭建成了一个网站(网站地址:Girl Friend Factory)。

笔者之前也写过一篇文章介绍了如何利用GAN生成简单的二次元人物头像,但那只是完全的随机生成,你无法控制生成出的人物的属性。但这篇Qiita的帖子不一样,我们可以指定生成人物的属性,如发色、眼睛的颜色、发型,甚至是服装、装饰物,从而生成具有指定属性的图像。

进入网站后,首先要等待模型加载(注意:这个网站国内可能出现连接不上的问题,需要自行解决。另外网站大概会下载70M左右的模型,需要耐心等待。)加载好后,点击上方的“無限ガチャ”(無限ガチャ实际上是“无限扭蛋器”的意思),就可以进行生成了。

对比原始的GAN结构,这里对生成网络G和判别网络D的输入部分做了更改:

对于图像生成网络G,原来是接收一个无意义的噪声z,输出一个图像G(z)。而这里不仅接收噪声z,还接收文字描述向量φ(t),用这两部分共同生成一个图像G(z, φ(t))。

对于判别网络D,原来是接收图像x, 输出打分D(x),现在不仅接收图像x,还接收文字描述φ(t)。最后输出打分D(x, φ(t))

声音

GAN之父在NIPS 2016上做的报告:两个竞争网络的对抗

GAN之所以是对抗的,是因为GAN的内部是竞争关系,一方叫generator,它的主要工作是生成图片,并且尽量使得其看上去是来自于训练样本的。另一方是discriminator,其目标是判断输入图片是否属于真实训练样本。

更直白的讲,将generator想象成假币制造商,而discriminator是警察。generator目的是尽可能把假币造的跟真的一样,从而能够骗过discriminator,即生成样本并使它看上去好像来自于训练样本一样。

本文主要分为一下几个方面:

  • 为什么要研究GAN
  • GAN的基本原理
  • 基于GAN的应用
  • GAN的tips和tricks——(下文简称t&t)
  • 研究前沿
  • 目前结合GAN与其他方法的主流图像模型——PPGN

GANs模型是一种使用监督学习来近似代价函数的生成模型,类似于玻尔兹曼机使用马尔科夫链近似或VAE使用变分下限来近似。GANs可以使用这种监督比率估计方法来近似许多代价函数,包括用于最大似然估计的KL散度。

GANs相对比较新,仍然需要进一步研究。特别地,训练GANs要求在高维、连续、非凸的策略函数中找到纳什均衡。研究人员应该努力发展出更好的理论依据和训练算法。除了GANs,这方面的进展也将应用到其他方面。

GANs对于图像生成、操纵系统等许多方面都具有重要意义,并有可能在未来应用到更广阔的领域。

Facebook首席执行官分享关于人工智能的3点心得

随着2016年邻近尾声,扎克伯格发布了一篇长博文,详细讲述了Jarvis可以实现的工作类别。他也提到了开发人工智能软件时遭遇的最大挑战,预测了人工智能的发展方向。他最重要的发现之一是:尽管人工智能正在飞速发展,却仍然需要人类给出足够的引导。

以下是这位Facebook首席执行官对于人工智能的现状、虚拟助手以及它们在未来的潜力的其他看法。

  • 家庭人工智能助手需要把一切设备连接起来
  • 手机是人工智能助手的完美载体
  • 文本输入和语音输入同样重要

科大讯飞刘庆峰:这一轮人工智能技术竞赛中国没有落后

作为目前深度学习的基础、人工智能的核心技术进展之一——以DNN(Deep Neural Networks,深度神经网络)为代表的神经网络算法已到了可以应用的时间节点。

现在业内公认2016年是中国人工智能的元年,那么在2017年,人工智能的核心在于如何在各个行业落地。”在接受记者采访时,刘庆峰直言,“中国人工智能的技术水平已经与其他国家不相上下,应用才是硬道理。”

实战

写给大家看的机器学习书【Part2】训练数据长什么样 机器学到的模型是什么

在《写给大家看的机器学习书》的第一篇,我们了解了机器学习的基本概念,机器学习的三个要素——数据、学习算法和模型。

在这个系列的第二篇,我将首先借有好货这个真实的应用场景,让大家看看数据长什么样,了解现实中的机器学习输入数据是怎么来的。

接着,我们需要引出模型的的符号化表示和定义。数学符号的引入一方面有利于后续进入到具体的学习算法的讨论时有更高的效率,另一方面这也是每个学习者准确理解机器学习绕不过去的一环。

然后,在理解了输入数据,熟悉了模型的符号化表示后,我们将对图1所示的相对粗略的机器学习流程做进一步的细化,细化后如图3所示。如果说学完这一篇你只能带走一点知识的话,那就带走图3吧。一图胜千言,以后别人再问你机器学习是什么,大胆说出让机器学习专家也吃惊的精准理解吧。

在这篇文章中,我们将接触到不少机器学习最常用到的名词、术语。不要小看名字的力量,一个东西一旦你知道了它的名字,就更容易注意到它的存在,并且掌握它。

李理:Caffe训练ImageNet简介及深度卷积网络最新技术

接下来我们介绍一下怎么用caffe训练ILSVRC2012。我们之前为了让大家理解卷积神经网络的细节原理,所以都是自己实现。但是在实际工作中,我们更倾向于使用成熟的框架来进行深度学习。caffe是一个老牌的深度学习框架,尤其是在计算机视觉领域很受欢迎。我们这里会简单的介绍一下怎么使用caffe训练ILSVRC2012,包括怎么用pycaffe使用训练好的模型,这在后面的Image Caption里会用到。

  • ILSVRC2012和ImageNet介绍
  • caffe简介
  • 获取ILSVRC2012数据
  • 数据预处理
  • 计算图片的mean值
  • 修改配置文件
  • 训练

通过上面的介绍,我们大致了解了Image Classification里最主流和state of the art的一些卷积网络结构,当然这只是视觉的一个任务,这里没有涉及到Location/Detection和Segmentation等其它任务,所以也没有设计R-CNN fast/faster R-CNN,YOLO SSD等。有兴趣的读者有了上面的基础应该是可以阅读相关的论文了解它们的原理。关于卷积神经网络的内容就介绍到这里,下一篇文章将会讲解RNN/LSTM的相关内容,敬请关注!

课程

基于Spark的分布式深度学习和认知计算

主题说明

你是否曾经面对多个优化算法不知所措?或者无法自由选择学习框架?又或许因为Caffe,Tensorflow, Theano, Torch的诸多参数设置而烦恼?或简单的认为只要有大数据就可以训练计算 机了?如果你不懂复杂的数学、统计学理论,还能做训练吗?…… 带着十万个为什么,让我们与深度学习技术大咖一起,了解基于Spark的分布式数据探索、机器学习/深度学习和认知计算。

适合对象

拥有海量数据并想进一步发掘信息价值; 了解业务数据,致力于商业智能的数据科学家、分析师; 想要缩短机器学习/深度学习训练时间、提高识别准确度; 从传统方法转向利用机器学习/深度学习解决业务问题。
学习要点

在学习过程中,你将了解:

  • 先进的分布式深度学习平台
  • 数据准备工作
  • 不同的数据如何对同一个模型产生影响
  • 数据的分布如何对训练产生影响
  • 如何把不同的数据结构转换成各种深度学习框架所能识别的格式
  • 并行化训练过程,并行化训练模式,差异点,监控和优化功能
  • 优化算法分享
  • 训练阶段常见问题,如何识别问题并给出修改模型的建议

无论你来自金融、教育、公共安全、零售、医疗、制造、图像/声音识别、机器人、自动驾驶、反欺诈、目标检测等等的任何一个领域,欢迎参与本课程学习。相信本课程结束后,你将掌握实 现高吞吐量的在线识别、预测服务的新方法。
我们的口号:让数据分析师也能设计神经网络,让数据科学家更专注于业务数据!


图片描述 图片描述

评论