渠道归因(一)传统渠道归因 小P:小H,我又来了。。。最近在做ROI数据,但是有个问题。。。 小H:什么问题,不就是收入/成本吗? 小P:是的,每个渠道的成本很容易计算,但是收入就有点问题了。 小P:不愧是你,对的,用户在付费前经历过很多渠道,我感觉把收入分给谁都不好说 小H:这个也不复杂,关于渠道归因的方式有很多种,比如传统渠道归因、基于马尔可夫链、基于shapley value甚至是基于Attention-RNN 说到渠道归因,那最容易想到的就是传统的渠道归因,这种方法一般是基于业务决策的。 首次归因:首次点击渠道赋予全部转化 末次归因:末次点击渠道赋予全部转化 线性(平均)归因:每个渠道均分转化 位置归因:自定义位置的权重,一般首位占50%,其余为0 时间衰减归因:距离转化的时间越短的渠道 实际上,传统的渠道归因是易于理解、好操作、结果接受程度高的~ 共勉~
要解决这个问题,我们需要一个关键工具:移动归因。一、 什么是归因,它又是如何工作的?简单来说,App归因就是识别并记录每一位新用户是从哪个渠道、哪个广告来的技术。它能帮助我们追溯用户的来源路径。 这种方式就像给设备发“身份证”,通过匹配用户点击广告和激活App时的“身份证”是否一致,来实现精准归因。这是目前最准确的方式,主要用于App内的广告投放。2.剪贴板归因这是H5页面引流的有效方式。 3.渠道包归因这是一种主要应用于安卓平台的归因方法。并在包内预先写入一个的渠道ID。这样,无论用户从哪个渠道下载,都能在App首次运行时,通过识别这个ID来追溯其安装来源。 二、 归因的三大实战场景理论最终要服务于实践。以下是三个常见的业务场景及对应的归因策略。场景一:多渠道广告投放,如何快速优化预算? 归因策略: 为每个微信群生成一个专属的归因二维码。用户通过不同二维码扫码参与活动,你就能在后台清晰地看到每个群分别带来了多少新用户。这样就能识别出哪些是高价值社群,值得投入更多精力去维护。
渠道归因(三)基于Shapley Value的渠道归因 通过Shapley Value可以计算每个渠道的贡献权重,而且沙普利值的计算只需要参加的渠道总数,不考虑顺序,因此计算成本也较低。 pd import matplotlib.pyplot as plt import seaborn as sns 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 总结 日常业务中,可以结合多个方法看一下归因的差异。
现通过实例说明通径分析的方法与步骤,并进一步了解通径系数的意义和应用。它的本质也是基于概率的一些计算。 3.4 马尔科夫链 在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。这种方法需要较多的数据,计算也比较复杂。 且只能衡量 Facebook、Instagram、Audience Network 和 Messenger 上的营销活动,我估计用的是增量模型(Uplift Modeling),这个模型在腾讯和阿里都有应用 无论是沙普利值和马尔科夫链哪种方法得到的归因结果都只能代表过去,要应用于未来的预算分配和媒体采购的话,我们还需要进行测试比较变化 不同点: 相比沙普利值,马尔科夫链的接触点先后顺序更被突出,而且这种顺序表现在紧邻的两个接触点移动的概率 当我们应用线性归因模型作为基准模型时,我们可以自定义的除了回溯期以外还有“根据用户互动度调整功劳”和“应用自定义的功劳分配规则”两个选项。
渠道归因(二)基于马尔可夫链的渠道归因 在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。 本文主要参考自python实现马尔可夫链归因[1]。 马尔可夫链是一个过程,它映射运动并给出概率分布,从一个状态转移到另一个状态。 所以马尔可夫链模型可以用来做归因分析。 pandas as pd from markovattribution import MarkovAttribution 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 共勉~ 参考资料 [1] python实现马尔可夫链归因: https://mattzheng.blog.csdn.net/article/details/117296062
解释 这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开app都回传给渠道商,渠道商自己归因 有的如华为是从应用商店安装时, 应用商店把归因信息写入到 app, 然后首次安装启动时能从本地存储获取到归因数据 曝光归因 曝光归因由于有数据量极大、不会使用此项 点击归因(常用) 所谓点击归因, 就是点击广告之后首个转化, 基本都是用这种方式归因 归因模型 首次归因模型 多个归因源事件时,认为第一个归因源事件的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。 平均归因模型 多个归因源事件时,认为每个归因源事件平均分配此次功劳。 时间衰减归因模型 加上了时间的影响因素,最后1次触达的贡献更高。 位置归因模型 多个归因源事件时,认为第一个归因源事件和最后一个归因源事件各占40%功劳,其余平分剩余的20%功劳。 使得服务器能够识别客户使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等 服务架构实现 接下来会参考这个图来整体说明 根据上图, 我们先给一个最基础的表结构,大家可以根据具体业务增减字段 # 应用表
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 **这是马尔可夫链的一个非常有用的应用。**在上述情况下,所有渠道C1,C2,C3(在不同阶段)被称为转换状态 ; 而从一个渠道转移到另一个渠道的概率称为转移概率。 1.2 absorption_matrix 吸收矩阵 参考:吸收马尔可夫链还有一篇论文:吸收态马尔可夫链及其应用 在马尔可夫链中,称Pij=1的状态为吸收状态。 论文:吸收态马尔可夫链及其应用中的一则使用: 2 R语言实现 基本,参考:数据运营36计:马尔可夫链对营销渠道归因建模,R语言实现 官方论文: https://papers.ssrn.com/sol3
这其实源于Android手机厂商的应用商店拦截/劫持安装包行为,使得原先应该归因给推广渠道的渠道包数据在下载环节被错误引导到手机应用商店的安装包上。 Android应用商店拦截如何正确归因数据作为第三方渠道归因监测工具,采用openinstall进行全局Last Click归因(最后一次点击归因),能够在数据统计上,有效避免因应用商店拦截/劫持造成的数据误差 即使用户在下载过程中被引导到任意应用商店,只要最终能顺利下载并打开App,就会归因最初点击的原始渠道进行绑定,从而通过数据还原事实上的推广来源。 因此通常来说,途中无论通过哪个应用商店下载,都不会影响广告归因结果的准确性。除此之外,openinstall会自动统计各个渠道的点击量、激活量和安装量等数据。 图片总结起来,Android手机厂商的应用商店拦截和劫持安装包行为导致了推广渠道的数据偏差,但通过使用openinstall这样的第三方归因监测工具,可以实现准确的数据归因和监测,还原真实的推广结果,帮助评估渠道质量
三) 1 Facebook Audience Network 当应用的广告在Facebook的媒体(含audience network联盟)曝光后,Facebook 会将媒体上报过来的曝光数据记录在其广告归因的后台上 当应用从 App Store 或者 Google play 上下载并激活应用后,Facebook要求广告主需要回传其应用的激活数据给到Facebook广告后台进行归因,只要有曝光过的广告媒体都可以分到该次激活的广告收入 详情可以看下我之前的文章《互联网归因混战江湖(二)—应用归因详细说明》 若你是做海外的广告,必须深入的了解下Facebook、Google 以及 第三方归因平台如AppFlyer、Adjust或者Kochava 广告主的增长营销团队,需要有一个对应用广告类广告归因研究比较深入的同学,因为只有这样你才知道这个“有效触点”归因的是哪些用户,哪些场景及其影响,认知到位了,才知道如何区分。 以Amazon和 Facebook的品牌号召力,在应用商店的免费榜单也是名列前茅,主动到应用商店去下载的用户很多。
今天,我们将列举一些常用的归因模型,并演示如何使用Googel Analytics 归因模型对比工具来为你的业务挑选最适合的模型。 归因模型应用示例 假设你的网站售卖烧烤架。 Google Analytics 归因模型101 在末次互动归因模型中,我们将转化的全部功劳归于用户的最后一个触点。 末次非直接点击归因模型忽视了直接流量,把转化功劳全归因于在完成销售之前的最后一次渠道点击。 我们再来看更多模型: 与末次互动相似,首次互动归因模型把转化功劳全归因于首次触点——在Grillmaster先生的例子中,即为自然搜索。 线性归因模型在各个渠道之间平均分配成功转化分数。 Google Analytics的归因模型 Google Analytics 的大多数标准报告使用的是末次非直接点击归因模型,但是现在我们可以通过对比归因模型,来决定使用为用户生命周期带来最高价值的模型
归因分析:马尔可夫链模型在广告转化路径中的应用 在数字广告领域,归因分析(Attribution Analysis)是衡量广告效果的关键技术。 传统的归因模型(如最后一次点击、线性归因)往往忽略了用户行为的复杂性和路径间的相互影响。 马尔可夫链模型(Markov Chain Model)通过捕捉用户路径中的状态转移概率,提供了一种更科学的归因方法。本文将详细介绍马尔可夫链模型在广告转化路径中的应用,并结合代码示例展示其实现过程。 归因分析的挑战 在广告投放过程中,用户通常会经历多个接触点(Touchpoints),例如: 点击展示广告 观看视频广告 搜索品牌关键词 直接访问网站 传统的归因模型存在以下局限性: 忽略路径复杂性:用户行为路径可能包含多个步骤 实际应用中的注意事项 数据质量:确保用户路径数据的完整性和准确性。 模型扩展:可以结合机器学习模型(如RNN)进一步提升预测精度。 隐私保护:遵守GDPR等隐私法规,对用户数据进行匿名化处理。 6.
不管是做FOF也好,仅仅想单纯归因也好,Brison是一种比较常见,也算是通用的归因方法,其一般用于权益类或者大类资产配置类基金。 其实Brison归因的逻辑很简单,假设有一个基准,基准在各类资产的配置上的权重分别是wbi(weight of benchmark of asset i),这些资产的收益率分别是rbi(return of benchmark of asset i),同样的,我们有一个需要归因的基金产品,也就是我们自己的组合,在各类资产上的权重是wpi(weight of portfolio of asset i),收益率分别是 所谓的Brison归因就是把一个组合的超额收益分解为资产配置的能力、个券选择的能力、以及交互收益。
让我们来看看每一个普及的模型,看看每一步骤的归因。这样我们就可以权衡利弊。 最后点击(Last-Click) ? 这归因模型功劳于转化前的最后一个通道,这就是我们以上举例的重定向广告。 这类归因模型允许你创建混合型最后单击和初次点击的模型,并给每个触达点相应的百分比。 优点:如果你的营销项目主旨是保持与用户的关系和认知,那么线性的归因就比较有用。比如说,如果你有一个品牌的广告项目,每一个媒介点在用户考虑阶段都同等重要,那么线性的归因能够帮助你您可视化这一进程。 缺点:时间衰减归因对最后转化有贡献,但是是初始的触达的渠道有打折扣,例如Facebook或者最初的搜索会话。 自定义(Custom ) ? 这就是“圣杯”归因模型! 你需要对其他模型非常了解再来运用自定义归因模型 正如你所看到的,这里有很多归因模型,找到一个适合你的业务的模型途径需要测试并且优化。使用一些虚拟数据集来测试不同的广告项目和媒介渠道。
本文将深入探讨LTA的局限性,分析其归因陷阱,并提出突破路径,帮助广告主从“流量思维”跃迁至“价值思维”。 二、LTA的三大归因陷阱:为何“最后一击”无法定义全部价值? 1. 三、突破LTA:从“单点归因”到“全局视角”的进化 1. 在GDPR、CCPA等法规日益严格的背景下,MMM成为符合合规要求的归因工具。 非显性渠道覆盖:有效评估线下广告、电视媒体等传统归因模型难以衡量的渠道价值。 多触点归因模型:平衡短期与长期价值 除MMM外,品牌还可结合其他多触点归因模型(如线性归因、时间衰减模型)优化策略: 线性归因:平均分配各触点的贡献值,适合强调全链路体验的品牌(如奢侈品)。 通过多触点归因,品牌发现LinkedIn广告对线索生成的贡献率为40%,并据此优化广告预算分配。 七、技术实现:构建多触点归因模型 1.
指标的异常归因是数据分析师日常工作中遇到的最高频问题之一。 关于异常归因的核心问题其实就两个:一个是从哪些维度进行指标拆解,另一个是各个维度之间的贡献度分别是多少? 我们在实际工作场景中就完全可以利用ChatGPT来提高日常归因的效率。
基于此,就有了线上全域归因、线上局部归因。 线上局部归因,我们目前的技术手段所实现的基本都是指的是线上的局部归因,是忽略了我们所不能掌握的因素的一种归因分析手段。 通过分析每个归因模型,我们可以更好地了解每个营销渠道的投资回报率。不一定有“最佳”归因模型,但我们可以选择一种作为报告和分析的主要归因模型。 - 最终互动归因 ? 通过归因,您可以了解整个客户旅程中不同的互动如何影响转化。传统归因归因于特定事件和任意事件,而最佳归因则使用机器学习和高级统计模型来了解每次触摸的精确影响。 各个领域的应用,需要结合业务具体的情况,设定一些基本的假设,例如数字营销有点击归因等模型,投资决策有分配、选择、相互作用的模型。 产品上,不仅仅是归因,还要解决洞察问题。 归因除了基于规则的实现,还有机器学习的实现方式,称为算法归因。 归因也可以从辛普森悖论里获得结论。
在移动互联网的精细化运营时代,简单的流量采买已经不能满足用户增长的需求了,我们需要的是基于数据的精准洞察,而应用归因、渠道归因和关系链归因对用户增长分析至关重要。 借助openinstall归因工具,运营团队能够实现多维度的归因分析,为业务增长提供科学决策依据。一、应用归因:定位用户的来源应用归因的核心目标是回答一个关键问题:用户从何处安装或启动应用? 无论是通过广告投放、社交媒体分享,还是自然搜索,用户首次触达应用的路径都需要通过归因技术来精准识别。 其核心是通过追踪用户间的邀请关系,量化每个节点的传播贡献,比如用户A邀请B安装应用,B再邀请C安装,想要了解A和B对C的影响,但分享链条的追踪十分困难。 结语:归因即增长应用归因、渠道归因、关系链归因的融合,本质是用户增长逻辑的重构,openinstall将复杂的归因体系转化为可落地的增长工具,帮助企业实现 “每一次投放都有迹可循,每一份关系都创造价值”
本文将介绍从用户视角出发的白屏检测方案以及线上白屏问题的大致归因思路。 ,但是像弱网这类环境问题想要精准归因势必要划分一个相对严格的阈值,这就会存在有些和阈值非常相近的弱网问题没有被归为弱网,那么这类问题就只能按照耗时异常的阶段来归因,例如DNS长耗时,TCP建连长耗时等。 如果一个日志不符合任意一种环境问题,那么就需要对白屏中的所有图片单独做归因,最后再取占比最高的问题类型作为整体的白屏归因。 归因策略特殊异常问题OCSP问题(网络篇有介绍),解码异常,证书校验异常此类问题都伴有特殊的基础库异常,可以直接归因,不像CDN节点异常和弱网之间存在着重叠部分,还需要现场信息佐证。 这也证明了该策略对脏数据归因的准确性。归因优先级我们目前问题归因的优先级从高到低如下,主要按归因证据的可信度来排序。
之前几篇多渠道归因分析应该算是比较通用的一些方法论: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因(三 ) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五) 加入 1.5 customer profile — embedding layer + ANN:额外融入用户属性信息 1.6 融合层 2 下游应用 2.1 下游应用一:分配路径权重 2.2 下游应用二 (markov考虑了顺序) 未融入用户属性信息 1.2 注意力的循环神经网络多点触摸归因模型框架 一种基于注意力的循环神经网络多点触摸归因模型,以监督学习的方式预测一系列事件是否导致转换(购买)。 2.1 下游应用一:分配路径权重 我将使用性能最好的模型来计算分配给每个通道的权值。
二、历史起源:从单点归因到多点归因的认知演进 归因模型的发展史,本质上是营销人对用户决策旅程认知不断深化、以及数据分析技术不断进步的历史。 数字营销中期:规则模型的出现:广告主逐渐意识到最终点击的弊端,催生了首批多点触达归因模型,如首次点击(强调拉新)、线性归因(平均分配)、时间衰减(越近越重要)、位置归因(U型模型,强调首尾)等。 四、主要应用场景与模型类型 以下是6种主流归因模型及其适用场景: 模型 核心规则 最佳适用场景 优点 缺点 最终点击 100%功劳给最后一次点击 销售周期极短、转化路径简单的直接反应营销(如促销)。 跨设备归因的挑战:用户可能在手机上看广告,在电脑上完成购买。传统基于Cookie的归因已失效,需要借助跨设备识别技术或概率模型。 线下转化的归因盲区:线上广告可能驱动线下门店购买。 窗口期长短会根本改变归因结果,需根据产品决策周期合理设定。 警惕“过度归因”与内部博弈:复杂归因可能让市场部声称对几乎所有销售负责,引发部门矛盾。