基于storm和hadoop的广告系统研究【7】
广告反作弊模型基于模型的作弊特征数据挖掘作弊数据处理
·
基于用户跟踪的数据进行挖掘,则初级挖掘数据表基础表如下:
页面记录表
序号 | 字段名 | 类型 | 注释 |
1 | id | int | |
2 | url | string | 页面地址 |
3 | StoreTime | time | 收集时间 |
页面关键词解析表
序号 | 字段名 | 类型 | 注释 |
1 | id | int | |
2 | pageid | int | 页面记录表id |
3 | keyword | string | 关键词 |
网页拓扑结构表
序号 | 字段名 | 类型 | 注释 |
1 | id | int | |
2 | pageid | int | 页面记录表id |
3 | refpageid | int | 来源页面id |
用户访问时段记录表
序号 | 字段名 | 类型 | 注释 |
1 | id | int | |
2 | userid | guid | 用户id |
3 | onlinetime | time | 上线时间点 |
网页被访问时段记录表
序号 | 字段名 | 类型 | 注释 |
1 | id | int | |
2 | pageid | int | 页面记录表id |
3 | requesttime | time | 被请求时间点 |
更多推荐
已为社区贡献3条内容
所有评论(0)