返回 登录
0

数据驱动:大众点评精准化营销实践

本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2016年《程序员》

导语:精准化营销是互联网业务在细分市场下快速获取用户、提高转化的利器,本文从数据体系架构和技术实现案例分享大众点评数据应用团队的尝试及经验。

总体框架

在介绍数据体系和框架前,为了方便大家理解,先简单阐述一下O2O营销的基本组成,我们从渠道和业务两个维度上抽象简化营销的表现形态见图1。

图片描述

图1 O2O营销的基本组成

横轴从营销发生的渠道(站内和站外),纵轴是营销的主题业务(流量和交易)。在这两个维度上,产生了多种营销的形态。而数据分析和挖掘在这个环节都能发挥很大的价值。这次我们主要从站内的精准化用户营销活动上介绍相关的工作,以后如有机会,后续再为大家分享站外流量和交易获取维度的内容,如DSP的精准投放,渠道价值排名和反作弊。

一个站内用户运营活动的生命周期大概可以归纳为确定目标、选取活动对象、设计活动方案、活动配置与上线、线上精准营销与动态优化以及效果监控与评估六个环节见图2。

图片描述

图2 站内用户运营活动的生命周期

在整个周期中,数据都存在巨大的发挥空间与价值。我们在项目启动后与业务充分沟通,了解其业务痛点,确定一期主要尝试从数据上帮助运营和财务同事解决以下几个问题:

  1. 营销活动前:确定目标和选取活动对象;
  2. 营销活动中:效果监控和跟踪,用户和商户端策略的输出;
  3. 营销活动后:效果评估和优化建议。

对于1的目标确定以前更多是拍脑袋决定,缺乏一套稳定的分析框架和模型。而活动对象,包括用户和商户/团单选取,更是需要业务和BI同学每次人工跑数据得出,效率低下。

而对2和3,更是缺乏一套公司的营销监控平台,时常出现预算花超不可控的情况。活动结束后,效果数据也是各个业务方自己给出,口径不一致导致难以整体评估效果。

系统架构

基于上述的业务场景和需求,我们用分层的金字塔架构设计了一套营销数据系统和服务,有效满足了业务的诉求并具有很好的平台扩展性见图3。

图片描述

图3 营销数据系统架构

最底层是我们的数据仓库和模型层,这里又大致可以分为三个主题:画像、运营和营销以及流量。这三个都是运营活动必不可少的数据组成部分。

图片描述

图4 用户标签体系

对于画像,我们的做法是部分自主建设,同时集成业务方,如搜索、广告和风控团队开发的画像标签,形成统一的画像宽表,目前我们的用户标签体系覆盖了包括基本信息、设备信息、消费浏览(如品类偏好和营销敏感度)以及特征人群等五个大类的180多个标签见图4。在标签的实现上,我们也秉承从需求出发的原则逐步迭代,从最初的以统计和基本的营销模型如RFM为主,到现在在潜在用户挖掘和用户偏好上开始探索使用机器学习的挖掘方法(见表1)。

图片描述

表1 不同挖掘模型的对比

在营销运营集市上,我们与财务和支付系统协作,开发了一套公司预算流水号系统。运营人员在配置活动时,从财务申请预算流水号,并在优惠后台配置与对应活动关联,用户享受优惠的每一笔订单都会在业务表中进行打点,做到在最细粒度上的预算监控。同时在用户、商品等维度建模后,形成了营销交易评估的指标体系:新用户成本,新老用户分布,7天、30天购买留存等。

活动评估的另一个维度就是流量,活动页的点击、转化漏斗、不同渠道来源等指标是运营人员无时无刻不关系的指标,这部分模型作为数据中心数据仓库中核心的一环。我们参考了其他公司的做法,建立了自己的PV、UV、Session以及路径树转化等模型,可以很好的满足运营需求。

在数仓之上,我们建立了数据服务层,在统一使用公司高性能的RPC框架之下,针对不同的上层选择了有差异化的数据存储和查询引擎,如画像服务更多的是满足线上业务系统的实时访问需求,并发和延迟都要求毫秒级的服务可用性,我们选用了Redis作为存储,而对于分析类产品,对并发和延迟要求相对较低,但对数据在不同维度上的聚合操作要求较高,在对比了Kylin、ElasticSearch、Druid后,我们决定使用ES作为存储和查询引擎。主要有两个理由:一是我们有留存等指标,需要重刷数据,而对于Kylin来说,这就意味着无法使用增量cube,必须重建整个cube,代价很大,同时ES在同样的维度上,空间膨胀度上比Kylin少近一半;二是ES整个系统设计和架构非常简洁,特别是运维方案简单,也有专门的工具支持,对于当时没有专职运维的开发团队来说是一个捷径。

最上层是数据产品和应用,针对前面提到的运营活动的不同阶段提供数据平台和工具:

  • 人群分析平台(hoek):用户可以通过选择画像服务提供不同的标签组合快速创建人群包,创建的人群包可以提供给其他不同业务和形态的营销工具,如push、促销工具等。后续还计划提供分析报告和对比等功能对用户选择的人群包进行360度的透视。

  • 智能发券引擎(cord):cord作为活动中进行精准化营销的重要组成部分,将业务活动开发和后台精准化营销进行了解耦,通过配置后台和hork平台,运营人员就可以完成定向活动受众和策略的配置,而无需开发接入见图5。具体细节在后面的案例分享中再详细介绍。

图片描述

图5 智能发卷引擎Cord

  • 云图/星图:云图和星图是产品和运营人员自助完成活动效果数据查询和分析的工具平台,通过将多维分析和营销指标结合后,运营人员将过去可能需要1-2天的数据分析需求在半个小时内就可以完成,提高了工作效率;同时我们还通过实时数据计算,提供了核心指标的实时数据(分钟,小时级别),相比之前T+1的数据实效性,在运营活动特别是大促期间,缩短了业务决策时间。

除了系统化的建设外,在运营活动的迭代中,我们与业务合作,进行了大大小小20多个专题分析,产出了包括闪惠预算动态分配,闪惠立减梯度优化,用户价值分以及免费吃喝玩乐选单等主题模型。帮助业务提高预算使用率30%,同时更好的评估拉新带来的用户价值。

而在开发过程中,我们也发现需要一个较为通用的挖掘平台,提供如特征选取和生成,模型训练和评估等功能,帮助分析师和挖掘工程师快速建模。因此也规划了基于Spark开发机器学习平台的建设。

整体的架构最终是为精准化营销服务,下面就结合两个案例具体介绍。

案例分享

外卖潜在用户挖掘与精准营销

精准营销一个主要的方向就是潜在客户挖掘,特别是在点评这个平台上,目前已有包括美食、外卖、丽人、教育等近20个业务,如何在平台近一亿的活跃用户中挖掘垂直频道的潜在用户就成了精准化营销的一个很现实的问题。Facebook和腾讯的广告系统都提供类似的lookalike功能,帮助客户找出和投放人群相似的用户群,其广告的点击率和转化率都高于一般锁定广泛受众的广告。

目前常用的潜在用户挖掘方案主要就是基于画像或者关系链的挖掘,我们团队从需求出发,结合点评的画像体系从关联规则;聚类和分类模型三个算法上进行了探索。对比效果如下:

未来我们除了在分类和聚类上进一步优化外,还计划利用点评好友关系,使用Spark的GraphX建立标签传播的算法进一步深挖高质量的相似用户。

微信红包精准优惠券引擎

另外一个精准营销的案例是智能发券引擎Cord,背景是点评会在微信群/朋友圈中用红包发各种优惠券,当好友来领券是如何决定发哪个业务什么面值的券更容易转化。本质上是一个简化的推荐问题,我们也参照广告系统的架构设计了Cord引擎。

主要包含分流模块(用于灰度发布和AB测试)、召回模块(负责从画像服务和优惠配置系统获取人和券的物料信息)、过滤模块(负责进行两者的匹配)和推荐模块(可以根据业务规则或者我们挖掘的策略对结果进行排序),返回给活动系统最合适的优惠券进行发放。整个系统实现完全服务化和可配置化,外部的活动系统可以根据配置的开关启用或者在特殊场景下禁用cord服务;而cord内部,也可以根据配置中心的设置,动态调整推荐策略。

在数据挖掘上,目前除了业务配置规则外,我们针对公司主流的运营方式,基于画像中的用户偏好和优惠敏感等标签进行综合打分,抽象了以GMV为目的和以拉新用户为目的的推荐策略。

总结

精准营销是目前大数据落地的一个公认的场景,但随着移动互联网和O2O的发展,这一领域也会有新的问题和挑战出现。结合我们这一年多的实践经验,团队也归纳了一套数据系统架构的设计原则:

  • 在数据架构和建设上,从需求出发,建立准确和易用的数据底层模型,统一指标体系和口径。

  • 在数据服务上,通过分层和SOA的思想,解耦与业务系统的逻辑。同时针对不同需求和场景选择适合的技术组件。

展望未来,在数据上如何快速的进行挖掘模型的开发,在架构和产品上满足更多场景,让数据在营销上发挥更大的价值是下一步的重点方向。


作者简介:

曹一帆,2012年7月从上海交通大学毕业,加入点评数据平台团队,进行大数据ETL,数据分析等工作,目前参与点评用户增长的数据挖掘工作。

毛天明,点评数据应用组高级工程师,负责精准营销、用户画像等项目,曾就职于百度基础架构部。

樊聪:点评数据中心数据应用负责人,目前主要负责点评精准化营销,用户画像和数据产品等工作,曾就职于微软,百度,对数据挖掘,大数据产品和服务等领域有一定研究。

责编:zhonghao@csdn.net

评论