在用户行为分析或产品流量分析工作中,漏斗分析是一种非常常见的分析方法。通过漏斗分析发现用户流失的关键环境,从而针对性地进行产品功能或运营策略地优化。在进行漏斗分析产品功能的设计时,需要搞清楚漏斗步骤的数据统计逻辑,这样才能更强契合实际的应用场景。根据漏斗各个步骤之间的数据处理逻辑不同,可将漏斗分为开环漏斗和闭环漏斗。
开环漏斗和闭环漏斗分别指的是什么?
开环漏斗:从名字上看,开环漏斗更加开放,即单一步骤对于用户流量的来源没有做严格的限制,不关注单个用户和用户触发事件的顺序,仅需要在指定时间范围内触发漏斗步骤对应的事件,就视为该步骤完成了一次转化。
闭环漏斗:要求步骤之间具有顺序性,即更多关注单个个体的用户行为路径,是否顺利地完成了一次漏斗转化。如果用户指定时间范围内触发漏斗第一步,并且在第一步发生后按顺序依次触发后续步骤(即存在与漏斗步骤一致的子序列),则视作该用户完成了一次成功的漏斗转化。
示例一:假设定义了一个漏斗由A、B、C三个事件构成,某一用户在限定时间内依次发生了事件B、A、C、B、C,那么开环漏斗和闭环漏斗的数据计算逻辑分别如下:
开环漏斗:步骤一(A事件)时间范围内触发1次,步骤二(B事件)时间范围内触发2次,步骤三(C事件)时间范围内触发2次。步骤一 -> 步骤二 转化率为 2 / 1 = 200%, 步骤二 -> 步骤三 转化率为 2 / 2 = 100%,漏斗总体转化率(第一步到最后一步)为2/1=200%(注:开环漏斗不关注发生顺序,不关注发生个体,只关注群体发生的指标)
闭环漏斗:该用户在时间范围内存在符合A、B、C的事件发生顺序子序列(B、A、C、B、C),因此该用户视为完成了一次完整的转化。对于整个群体而言,计算完成转化的用户数 / 全体用户数 即为该漏斗的转化率。
示例二:假设一个漏斗的步骤依次为A、A、B两个事件。
开环漏斗:若用户时间范围内发生了事件A、A、B、B,则步骤一(A事件)触发了2次,步骤二(A事件)触发了2次,步骤三(B事件)触发了2次,则步骤一 -> 步骤二 转化率为 2 / 2 = 100%,步骤二 -> 步骤三 转化率为 2 / 2 = 100%
闭环漏斗:若用户时间范围内依次发生了事件A、B,则因为该序列不存在A、A、B的子序列,因此不构成一次转化;若用户依次发生事件A、C、A、B,则因为存在子序列,完成了一次转化;若用户依次发生了事件A、B、A,则因为该序列不存在A、A、B的子序列,因此不构成一次转化。
再看一个闭环漏斗的例子,假设一个漏斗中包含了 A、B、C、D、E 五个步骤,选择的时间范围是 2015 年 1 月 1 日到 2015 年 1 月 3 日,窗口期是 1 天,那么,如果用户在2015年1月1日到2015年1月3日触发了步骤 A,并且在步骤 A 发生的 1 天内,依顺序依次触发了 B、C、D、E,则视作该用户完成了一次成功的漏斗转化。在这个过程中,如果穿插了一些其它的步骤或者行为,例如在满足时间限制的情况下,用户的行为顺序是 A > X > B > X > C > D > X > E,X 代表任意一个事件,则该用户依然视作完成了一次成功的漏斗转化。
如果该用户在这个时间限制范围内,依次触发了 A > B > C > E,则该用户没有完成该漏斗的转化,并且会被记作步骤 C 的流失用户。
考虑一个更复杂的情况,如果一个用户在所选时段内有多个事件都符合某个转化步骤的定义,那么会优先选择更靠近最终转化目标的事件作为转化事件,并在第一次达到最终转化目标时停止转化的计算。假设一个漏斗的步骤定义是:访问首页、提交订单、支付成功,那么不同用户的行为序列及实际转化步骤(标红部分)见如下例子:
漏斗分析中展示的数字代表转化/流失的独立用户数,而非触发的事件次数。在该时间范围内,即使一个用户多次完成漏斗,也仅计数一次。
在统计逻辑上,闭环漏斗更加严谨,但技术实现上难度更大,因为需要将单个用户的事件行为序列按照时间进行计算,而开环漏斗,由于其开放性,则只需要针对单个步骤进行统计即可
思考:根据开环漏斗和闭环漏斗的统计定义,他们各自的使用场景是什么呢?实际进行漏斗分析时,该如何选择?