返回 登录
0

【AI每日播报】Google发布目前最大视频数据集

【AI每日播报】每日早8点为您搜罗24小时内AI圈新鲜要闻,涵盖从资讯到声音、从论文到活动的全方位AI消息。

图片描述


头条


【数据】谷歌发布目前最大视频数据集,该数据集包含标注框

@GoogleBlog

昨日,谷歌宣布开放了一个基于 Youtube 视频的图像数据集 Youtube-BoundingBoxes Dataset,为所有研究者进行模型训练和研究提供了新资源。谷歌宣称这个数据集的检测数量(detection count)为ImageNet的五倍。

该视频集被命名为YouTube-BoundingBoxes,共有500万个标注框,囊括23类对象,密集地标注了从210,000个YouTube视频上得来的视频片段。

【库】谷歌发布可批处理动态计算图的深度学习库 TensorFlow Fold

@GoogleBlog

TensorFlow Fold能对不同大小、结构、功能的数据进行批处理。通过为每个输入构建单独的计算图解决由于输入的大小和结构不同导致的问题。此外,通过动态批处理,实现了在 CPU上增速10倍以上,在GPU上增速100倍。同时发布的论文详解了该新功能的技术细节。

论文地址谷歌博客原文(需翻墙)、Github地址、中文翻译

【趣味】这是一个暗中观察特朗普Twitter动向的股票交易机器人(Github项目)

@Github

特朗普的微博最近很火,Github上的这个机器人监控特朗普的Twitter动向,根据其对各个上市公司的态度来实时进行股票交易。


学术


【论文】ICLR2017 接收论文列表

@openreview.net

4月24-26日,ICLR 2017 将于法国举办。标题指向的链接页面包含本届ICLR大会的所有论文,页面已释放一段时间,各论文下方已形成讨论。

【实战】Facebook官方详解:使用Apache Spark进行大型语言模型训练

@机器之心

Apache Spark 是用于大规模数据处理的快速和通用引擎,它运行在 Hadoop,Mesos,可以离线或云端运行,具有高速、可扩展等特点。近年来,在 IBM 等大公司和众多社区贡献者的推动下,Spark 得到了越来越多的应用。今天,Facebook 团队也展示了他们使用 Apache Spark 进行大型语言模型训练的方法。

【实战】GAN的理解与TF的实现

@知乎专栏

本文会从头了解生成对抗式网络的一些内容,从生成式模型开始说起,到GAN的基本原理,以及InfoGAN,AC-GAN的基本科普。

在很多machine learning的教程或者公开课上,通常会把machine learning的算法分为两类: 生成式模型、判别式模型;其区别在于: 对于输入x,类别标签y,在生成式模型中估计其联合概率分布,而判别式模型估计其属于某类的条件概率分布。 常见的判别式模型包括:LogisticRegression, SVM, Neural Network等等,生成式模型包括:Naive Bayes, GMM, Bayesian Network, MRF 等等… …

【实战】令人拍案叫绝的Wasserstein GAN

@知乎专栏

在GAN的相关研究如火如荼甚至可以说是泛滥的今天,一篇新鲜出炉的arXiv论文《Wassertein GAN》却在Reddit的Machine Learning频道火了,连Goodfellow都在帖子里和大家热烈讨论,这篇论文究竟有什么了不得的地方呢?

要知道自从2014年Ian Goodfellow提出以来,GAN就存在着训练困难、生成器和判别器的loss无法指示训练进程、生成样本缺乏多样性等问题。从那时起,很多论文都在尝试解决,但是效果不尽人意,比如最有名的一个改进DCGAN依靠的是对判别器和生成器的架构进行实验枚举,最终找到一组比较好的网络架构设置,但是实际上是治标不治本,没有彻底解决问题。而今天的主角Wasserstein GAN(下面简称WGAN)成功地做到了以下爆炸性的几点… …


本期周刊:【CSDN AI 周刊】No. 008 | 李沐回顾博士五年 孙剑谈CV问题

订阅请点击【这里】


【CSDN_AI】面向AI从业者及研究员做深入讨论与交流,分享业内领先案例

扫码关注CSDN AI公众号 「人工智能头条」

图片描述

评论