返回 登录
0

广发英雄帖——SMP 2017 CSDN用户画像技术评测正式启动

用户画像(user profiling)能够反映用户人口统计学特征、行为模式、兴趣偏好等不同维度的属性,它是互联网时代实现精准化推荐和个性化服务的必经之路,在网络营运、管理和安全等领域具有重要意义。 继2016年新浪微博用户画像技术评测火爆开展之后,SMP 2017 CSDN用户画像技术评测正式启动。

图片描述

本次用户画像评测具有三大特色:

  • 有趣的数据集——由全球最大的中文IT技术社区CSDN提供超过10万用户的内容数据(博客、帖子等)和行为数据(浏览、评论、收藏、转发、点赞/踩、关注、私信等);
  • 有挑战的任务——聚焦CSDN用户画像问题,具体评测任务包括用户内容主题词生成、用户兴趣标注以及用户成长预测;
  • 丰厚的奖励——总奖金3万元,第一名奖金1万元;所有获奖者将被邀请在SMP
    2017会议上作口头报告;前30名均可获得由中国中文信息学会社会媒体处理专委会颁发的名次证书。

现广发英雄帖,Coder们大展身手的机会来了!

任务描述

参赛队伍利用给定的CSDN数据集,针对CSDN用户进行画像,具体包括以下三个评测任务

任务1:用户内容主题词生成

给定若干用户文档(博客或帖子),为每一篇文档生成3个最合适的主题词。要求生成的主题词必须出现在文档中。

任务2:用户兴趣标注

给定若干用户的文档信息(博客或帖子)和行为数据(浏览、评论、收藏、转发、点赞/踩、关注、私信等),为每一个用户标注3个最合适的兴趣方向。标签空间由CSDN给定。

任务3:用户成长预测

给定若干用户在一段时间内(至少1年)的文档信息(博客或帖子)和行为数据(浏览、评论、收藏、转发、点赞/踩、关注、私信等),预测每一个用户在未来一段时间内(半年至1年)的成长值。用户成长值是根据用户的综合表现打分所得,但不会公布具体打分准则。成长值将会归一化到[0,1]区间,其中值为0表示用户流失。

竞赛规则

  1. 所有参赛选手都必须在评测管理系统biendata.com中注册;
  2. 参赛选手在管理系统中组队,每支队伍最多不超过10名队员;
  3. 每支队伍需指定一名队长,队伍名称不超过15个字符;
  4. 每名选手只能参加一支队伍,一旦发现某选手以注册多个账号的方式参加多支队伍,将取消所有相关队伍的参赛资格;
  5. 参赛队伍在评测集发布之前允许进行队伍合并,但不能拆分,且合并后的队伍不得超过总人数上限(10人);
  6. 允许使用开源代码或工具,但不允许使用任何未公开发布或需要授权的代码或工具;
  7. 允许使用互联网上公开发布的词典数据,但不允许从CSDN网站爬取主办方提供的数据集之外的任何数据;
  8. 参赛队伍可在评测集发布之前随时上传验证集的计算结果(每日最多可上传5次),管理系统会及时更新各队伍的最新排名情况;
  9. 评测集发布后,参赛队伍需要在24小时之内计算出最终结果并提交,各参赛队伍要提前确保算法能在24之内完成计算。

重要日期

5月03日:发布评测方案,开始报名
6月01日:发布训练集
7月01日:发布验证集,开始提交验证集中间结果
7月31日:停止提交验证集中间结果
8月01日:发布评测集,24小时之内提交评测集最终结果
8月20日:公布名次及获奖者名单
9月16日:颁奖典礼及研讨会报告

更多活动详情报名地址点击:大赛官网

评论