前一节讲到多种流量归因的模型,本质上流量归因是为了辅助我们如何将钱花的更有价值以及高效洞察用户的习惯和行为,为下一步迭代产品的功能提供数据支撑。今天这一节,结合具体的业务场景来看看流量归因分析如何在数据采集方案上落地的。
业内通用五大基本归因方案 旺盛的小草,公众号:万能的小草网站及APP坑位流量归因分析-(1)理论篇
一、背景
比如B站的产品内,提供了非常多的入口能够使得用户进入直播间里面。(如:首页推荐、搜索入口、关注入口、历史记录、我的收藏 etc),房间的效果是否符合预期,他们给整个平台以及娱乐分区分别共享了多少流量,以及带来了多少付费用户,这些都是产品和运营同学日常工作中比较关心的内容。
经常会有这些问题围绕着运营:
二、目标
其实上述问题,占用了数据分析同学大量的时间去排查。由于涉及到主端APP的快速迭代,单次的分析很难实现复用,因此在这种背景下急需提供标准化的流量归因产品去快速实现流量来源拆解,快速定位KPI异动原因,满足业务运营的日常监控诉求。
类别 | 时间维度 | 用户类型 | 解决的问题 |
---|---|---|---|
流量入口 | 日、周、月、季度、年 | 整体、新增、留存、回流 | 有多少用户来过此入口观看时长、弹幕量、投币量、次日留存率流量入口交叉对比分析 |
三、准备工作
为了实现流量的快速归因,需要依赖于我们有完善的数据采集。过程中需要解决的问题:
业内常用的是session_id
2. 计算路径去重:统计页面跳转记为有效路径,不同层级跳转记为无效路径,剔除异常数据。
数据采集需要的信息如下:
字段顺序 | 字段名称 | 字段类型 | 字段注释 |
---|---|---|---|
1 | bili_code | STRING | 埋点点位编码 |
2 | app_key | STRING | APP编码 |
3 | app_name | STRING | APP名称 |
4 | page_code | STRING | 页面编码 |
5 | page_name | STRING | 页面名称 |
6 | dateline | BIGINT | 时间戳 |
7 | uuid | STRING | 用户唯一编码 |
8 | user_id | BIGINT | 用户user_id |
9 | up_id | BIGINT | UP主ID |
10 | ip | STRING | 用户IP |
11 | occur_time | BIGINT | APP埋点触发时间,毫秒时间戳 |
12 | session_id | BIGINT | 会话ID |
13 | version | STRING | APP版本号 |
14 | event_id | BIGINT | 事件ID |
15 | business_id | BIGINT | 埋点时所在业务编码 |
16 | ext_up_id | BIGINT | ext中UP主user_id |
17 | up_id_com | BIGINT | 用户跳转UP主号 |
18 | pos | BIGINT | 推荐运营位 |
19 | business_name | STRING | 业务名称 |
20 | page_combine | STRING | 统一页面名称 |
21 | r_business_id | BIGINT | UP主对应业务ID |
22 | r_business_name | STRING | UP主对应业务名称 |
本期介绍如何去做归因分析的数据采集,下一篇文章会实战介绍如何将采集的信息进行算法分析统计。
🧐欢迎大家分享、点赞、在看,给个3连击呗!👇