返回 登录
0

【SDCC专访】echo陈健:个性化推荐和版权识曲之路初探

2016年9月22日-23日,由CSDN重磅打造的大数据核心技术与实战峰会、互联网应用架构实战峰会将在杭州举行。

SDCC 2016大数据技术&架构实战峰会(杭州站)是由CSDN主办的顶级技术盛会,大会目的是促进更加深入的业内同行技术交流,传播先进技术理念。SDCC 2016·杭州站为期两天,主要面向对大数据/架构技术感兴趣的中高端技术人员,将秉承干货实料(案例)的内容原则,聚焦技术实践,结合业务,邀请业内顶尖的架构师和技术专家,共同探讨海量数据下的应用监控系统建设、异常检测的算法和实现、大数据基础架构实践、敏捷型数据平台的构建及应用、音频分析的机器学习算法应用,以及高可用/高并发/高性能系统架构设计、电商架构、分布式架构/微服务等话题与技术。

大会前夕,有幸邀请到echo数据组算法工程师陈健接受CSDN记者专访。

图片描述
echo数据组算法工程师 陈健

陈健,12年毕业于比利时天主教鲁汶大学人工智能专业,先后在百度搜索研发部,晶赞科技任职;现任echo数据组负责人,负责音乐推荐和音乐分析的工作。研究方向为广告算法,推荐系统和音乐分析。目前致力于使用机器学习算法分析音乐的内容,包括music embedding和music tracking等。擅长scala编程以及spark上机器学习模型的开发以及音乐音频分析。

以下为采访正文


CSDN:首先请简单介绍下自己以及目前的工作重点。

陈健:我是echo的数据组负责人陈健。目前在echo的工作重点是推荐系统和音乐分析。推荐系统方面,主要是echo的首页瀑布流的歌曲个性化推荐以及歌曲播放详情页的相似歌曲推荐。音乐分析上,目前工作点2个。一个是从音频上分析歌曲的相似度,用于检查echo用户所上传的歌曲,是否属于未收录版权的歌曲,避免版权纠纷。另一个是音乐节奏点提取。目前echo提供了类似于节奏大师和Deemo的音乐打击类游戏,因此需要通过算法抽取音乐中存在的节奏点对信息,包括所在的时间点,音符,音高等。

CSDN:能否详细介绍下echo的业务体系?其用户流量有什么特点?

陈健: Echo的目标是创造一个属于年轻人的文化品牌,包括音乐,影视,创意和时尚领域。Echo的业务体系主要包括以下:Echo回声,Echo品牌的酒吧咖啡馆M64和Echo嘉年华音乐节。

  • Echo回声是一款多元化的音乐APP,有移动端,PC和网页端。Echo APP主要包括三个板块,echo回声歌曲和MV推荐,echo TV直播,echo红人。Echo回声的歌曲有2个特色,一是每首歌曲都会配上相应的精致封面,另一个是音乐环绕感觉的3D音乐。

图片描述

  • Echo品牌的酒吧M64位于上海陕西南路,其中酒吧分为2部分区域,位于前部的是音乐小清新的咖啡馆,之后内部是隐秘的酒吧。

  • Echo嘉年华音乐节每年夏季举办,音乐节会搭建多个舞台,每个舞台的表演各有特色。今年刚刚举办的音乐节邀请的嘉宾就有朴树,蔡依林,孙燕姿,薛之谦,Jessie J和DJ Shadow等。

图片描述

Echo的用户品味多样,乐于互动。Echo除了提供的流行歌曲外,echo会采集互联网上备受喜爱的各类特色的音乐,包括爵士,电子和日韩等,来满足用户多样的品味。用户的参与上,除了用户会上传它们精心制作的翻唱或者原唱的歌曲外,echo提供的独特的弹幕音乐,每个用户在收听歌曲的同时,可以互相交流每一时刻或者音符的感受。

CSDN:时下,机器学习在大数据生态领域中处于什么地位?在音乐分析中的具体应用有哪些?

陈健:机器学习是实现数据价值的工具。大数据生态领域中,收集数据,存储数据和ETL等,都属于数据预处理的过程,属于将互联网上的数据输出为格式化的数据。但是如果需要挖掘这些数据中存在的模式和商业价值,那么就需要机器学习的方法。比如在线广告的点击率预测,就需要通过机器学习来高效挖掘出数据中的点击率模式,从而完成个性化的定向广告推广。

机器学习的方法在音乐分析中也有广泛的应用。音乐分析中的音符提取,首先根据spectral flux方法生成音乐中音高变化明显的所有点,然后使用LSTM-Bidirectional RNN,分析哪些点可能属于真实的音符点。还有在音乐分析中的音频指纹生成,就可以有end to end的方法,输入的是音频的波形数据到多层CNN(卷积神经网络),提取音频数据潜在的频域特征(替代傅立叶变化)生成高阶的特征,然后通过将这些特征再次输入到多层RBM(Restricted Boltzmann machine)中提取特征的分布模式,最终获取到一个feature向量,该向量可以作为音频的广义表达。

图片描述
配图来源:A Deep Bag-of-Features Model for Music Auto-Tagging
;Juhan Nam, Member, IEEE, Jorge Herrera, and Kyogu Lee, Senior Member, IEEE

上图中,不同类型的特征的相似矩阵,可以看出随着深度神经网络层数的叠加,不同类别的音乐区分度越高,相似类型的音乐越明显相似。比如电子音乐Electronic和高科技舞曲Techno都依赖于计算机对音效的处理,因而在听觉上是相似的。

CSDN:echo作为一款3D音乐软件,用户体验非常关键,在产品稳定和用户体验上有哪些值得分享的经验?

陈健:比如echo的测试,为了测试出歌曲播放过程中可能出现的bug,会将一直处于播放状态。比如日志记录上,我们会对每个功能进行埋点,监测用户每个功能使用的时长和可能出现的异常情况。通过这些数据,我们可以挖掘出需要改进的界面或者功能点,也可以挖掘出导致用户流失的原因。

CSDN:目前echo已发展相对成熟,未来有哪些需要改进的方向?

陈健: Echo回声的主要方向是让所有的用户参与到音乐中,无论是制作,收听和评论音乐,从而构建基于音乐的娱乐文化社区。目前普通用户制作音乐的成本较高,未来可能在echo回声APP中提供更简洁高效的工具方便用户来创作音乐。

CSDN:在本次SDCC 2016(杭州)大数据峰会上,您分享的话题是?

陈健:本地分享的话题是“echo个性化推荐和版权识曲之路”。我会分享echo如何使用Logistic Matrix Factorization进行个性化的推荐和机器学习在音频特征提取上的应用。

评论