“是谁送你来到我身边”
“是那圆圆的明月,明月”
--西游记插曲《天竺少女》
归因,也叫Attribution,广义地说是指人们对他人或自己行为原因的推论过程。
在广告系统中,归因过程去做的事情是将转化的功劳分配给用户完成转化之前所经历路径中的不同广告、点击和其他因素。下面是一个用户在日常广告生态中的一个简化的历程。
先来看一个场景:
张三,新生态农民工,日常996,今天10点下班打开电梯,发现里面焕然一新,一张“好就是贵,贵就是好”的宝沃汽车宣传广告直击灵魂,于是不忍每天地铁公交上下班的张三,立刻扫码下单一辆“好贵”的车,开启了幸福生活。
好贵老板在发完汽车快递给张三后,就琢磨着:这张三怎么知道我们好贵汽车就是又贵又好的呢?他肯定是看到我们的广告了!但是我们在京东、淘宝、电线杆都投过广告,他是在哪里看到的呢?我来看看他的下单链接,哦,原来是扫码的电梯广告!好,下个月再投200W给电梯广告!
上面的过程,完整的描述了一个广告投放、展示、转化、归因、最后优化投放的过程。而归因的作用,就是让好贵老板(广告主)知道了,张三(消费者)是从哪个渠道了解好贵并下单的,从而好贵老板(广告主)就知道了哪个投放渠道效果好,后续优化了投放策略。
我们现在把注意力从好贵老板放到移动互联网来,App的开发者们都知道,ROI是衡量一个产品可行的很重要的指标,而广告投放的渠道以及在各渠道的投放比重是关系ROI的直接因素,一款应用从首次去投放,到出现在广告栏位,到完成下载,再到最后的完成变现,这个期间可能会经过多个渠道,其中就会涉及到移动归因。
所以说,无论做的是何种类型的产品,只要使用广告投放的形式来获取用户,就需要归因。
而在了解了归因的价值之后,我们就可以基于归因,来做更多有价值的事情:
首先,我们来看一下App开发者们对于归因的诉求,
核心需求:
加分项:
归因数据来源,总的来看分为三类:媒体平台、三方归因平台和自建归因平台。由于投放和归因之间的亲密关系,使得移动App的开发者们永远不会去完全的相信投放平台给到的归因数据,因此更多的选择是使用三方归因平台。那么我们来看一下,三方归因平台在一次广告归因中存在于什么地方:
站内归因这里简单提一下,因为不是我们当前主要的业务范围。
一个常见的场景,大家逛京东买东西的时候,最终下单的商品是从哪儿来的呢?可能来自关键字搜索,或者是通过banner展示的商品点击,或者通过DPA广告带来的,那这个该怎么评估呢?这就需要站内归因来解决。
了解下来,市面上支持站内归因的产品不多,有一个Adobe Analytics。感兴趣同学可以去看看。
站外归因,显而易见就是一般人理解的app流量是从哪个渠道归来的,或是哪个渠道带来的转化。
已经诞生过了三家独角兽企业,都是估值超过10B美元
行业标杆,占据非中的最大监测份额。2011年成立,一家以色列公司旗下移动归因与营销分析平台品牌。同年获得700W的A轮,2018年已经实现单季度经常性收入1亿美元。
2012年创建于德国的一家创业公司,专注于移动广告监测业务,目前SDK注入全球13亿个移动设备。2017年进入中国,2018年成为腾讯广告监测合作伙伴,2021年加入tiktok营销合作伙伴,随后被AppLovin收购。
2014年成立于美国,当前超过75,000款App使用,目前美国90%的移动用户都有虚拟的Branch ID。Branch的优势也是在于深度链接和虚拟的Branch ID。
2011年成立于北京,专注于移动互联网综合数据服务的公司。旗下的Ad Tracking是服务于开发者的第三方移动广告效果监测平台,已对接百余家广告平台。
2013年成立,一家专注于第三方的移动端大数据分析服务商,旗下的TrackingIO产品面向开发者推出的第三方广告监测平台。据了解,TrackingIO当前主要是Last-Click归因模型来驱动,其收费模式分为两种,广告数据监测功能按点击来付费;用户行为分析按照功能来收费,两种收费模式的封顶收费都为30w。
国内第三方全域数据服务商,旗下AppTrack提供移动广告监测,有提供免费版和Pro付费版。
这里需要单独拎出来看的是,除去三方归因外,现在有能力的开发者,达到一定规模后,更多会选择自建归因平台。之所以会选择自建的原因有多个:
根据归因服务市场概况 ,广告主自建归因数量占比67%,我们看国内数据:
从当前国内来看,因为都是国内开发者,热云的接入量最大,且数据质量不错,有走海外业务的会采用AppsFlyer,数据质量也可以。相反,友盟(付费版)的使用率当前是最低的,这个可能也有原因是友盟被阿里收购之后,其独立性已经不被认可。
我们再挖掘一下一开始提到的场景:
原来回顾张三买车的历程,发现在这一周内,周一逛京东的时候就看到过好贵汽车广告,周二地铁电视上看到了同款汽车的推荐广告,周三刷抖音的时候看到了视频广告,周四下班路上在电梯间看到了广告,心里受到刺激,最终购买决定购买,并在周末找了朋友在4S店购买了该汽车。
在上述场景中,广告主一共投放了4条渠道的广告,分别是:搜索广告、地铁广告、信息流广告和电梯广告,每条广告其实都影响了张三。
那么,问题来了,最终张三购买广告是归功于哪条渠道呢?
上面描述的是一个非常普遍的场景和问题了,我们先不说答案,不过一个可以确认的回答是,任何归因工具中都不会将功劳归因于直接访问(除非转化路径只包含直接访问)。也就是从归因角度来看,张三的朋友仅仅是个工具人,不会从这次交易中获利。
通常情况下,转化功劳会被全部归于客户最后点击的那条广告(也就是上文的电梯广告)。但仅仅是最后那条广告促使客户完成转化吗?客户在点击最后那条广告之前点击的其他广告难道没有帮助呢?
这个问题就是归因模型要去解决的关键问题了。在广告的归因中,归因模型是指一条规则、一组规则或以数据为依据的算法,用于确定如何将转化功劳分配给转化路径中的各个接触点。
在介绍具体归因模型之前,我们需要先了解两个概念点:归因窗口和归因触点。
下面我们来系统的看一下归因模型的分类
以规则为依据的归因模型,都是根据固定的转化功劳分配规则去进行的,不会去考虑转化类型或用户行为。我们可以从触点方式来进一步分类。
单触点归因主要将转化归功于某一次接触点,该方式较常用。
无时间窗口指的是当前归因模式是不需要设定一个归因时间段,可以划分为两种
中国特色的归因方式,缘由国内喜欢为每个媒体单独打一个渠道包(APK),这样在用户最终转化的时候,可以直接根据渠道信息来进行归因。
从技术方案上说,是最容易实现的方式。但是会存在的问题,比如用户从今日头条的广告看到一个推荐游戏App并下载,结果手机厂商跳转到了厂商应用商店进行下载,最终用户下载的是手机厂商渠道的APK。如果按照渠道包归因,就会把本次应该属于今日头条的归因到了厂商,这显然是不合理的,因此在早期有过一次集体从渠道包归因转为点击归因的方式。
落地页归因大多存在于投放H5落地页的广告计划,典型的从H5拉新、到App激活、到下单这个过程。在上述整个链路中会有两个断层,影响到我们去如何归因。
后续App内LTV就用App内那一套。因为生成口令时要用H5落地页Url,所以激活用户归到口令上,口令又能归到H5落地页Url上,从而就完成一次归因。
简单直接,在归因窗口期内,以转化时间点倒推,寻找所有媒体渠道的触点,并选择最后一次触点作为转化来源(其余的算为自然量),这也是大多数分析平台的默认归因方式。
优点:归因方式简单,且逻辑清晰,在大部分场景下是合理的
缺点:无法告知激活用户是从哪里来的,从而也无法为你的广告预算优化提供合理的方案。
首次点击归因的方式很明显,与Last-Click相反,就是将转化来源归因于第一次触点。不过大多数分析平台,都不会采用这种当时去做默认的归因设置。
优点:用户最初是怎样找到你的。而且归因对数据的要求也不大,只需要追踪第一个被点击的渠道即可。
缺点:很多时候,首次引起用户点击的渠道并不会对用户最终的购买及下载行为起决定性作用。如果首次点击行为发生在很久之前,甚至超过了数据追踪周期,这种归因方式就无法定位到真正的首次点击渠道。
展示归因用于对用户安装应用前所进行的浏览行为进行监测及归因。也就是说,展示归因不再聚焦在用户触点,而是用户对展示广告的浏览。在展示归因的体系里,所有在用户正式发起下载行为前浏览的相关广告都被认为是这个下载的影响因素。
优点:展示归因能够让广告主清楚知道哪个渠道在什么时候接触到用户,展示广告在引导用户进行购买时发挥怎样的作用,观看广告后应用安装情况及数量等等。而且随着视频广告的广泛使用,展示归因能够更准确地反映这些广告的实际推广效果,从而让营销者做出更加准确的决策。
缺点:展示归因可能存在隐藏的假量问题。有些发行商会伪造大量的广告浏览量,将应用最终的下载归因到自己的广告上。同时,广告是否真正被浏览也值得考究(停留时长问题)。
有效播放归因多存在于视频广告,尤其是在当前的短视频App,如抖音,当用户在刷视频的过程中可能全程不会去操作点击,因此需要一个更合理的方式来评估内容的价值。因此通过一个有效播放时长和点击同时认定为一次有效操作。而当用户在观看一定时间,随后又发生了转化行为后,则认定转化来源为当前抖音的播放。
也就是俗话说的吃大锅饭。线性归因将转化来源对于路径上所有触点的渠道,平等地分配他们的贡献权重,是多触点归因模型中最简单的一种。
优点:可以将功劳划分给转化漏斗中每个不同阶段的营销渠道,而且计算方法也比较简单。
弊端:很明显,线性平均划分的方法不适用于某些渠道价值特别突出的业务。
适用于:根据线性归因模型的特点,他更适用于企业期望在整个销售周期内保持与客户的联系,并维持品牌认知度的公司。在这种情况下,各个渠道在客户的考虑过程中,都起到相同的促进作用。
对于路径上的渠道,距离转化的时间越短的渠道,可以获得越多的功劳权重。时间衰减归因模型基于的假设是:触点越接近转化,对转化的影响力就越大。这种模型基于一个指数衰减的概念,一般默认周期是7天。也就是说,以转化当天相比,转化前7天的渠道,能分配50%权重,前14天的渠道分25%的权重,以此类推。
相比线性归因模型的平均分权重的方式,时间衰减模型让不同渠道得到了不同的权重分配,当然前提是基于“触点离转化越近,对转化影响力就越大”的前提是准确的情况下,这种模型是相对较合理的。
缺点:这种假设的问题就是,在漏洞顶部的营销渠道永远不会得到一个公平的分数,因为它们总是距离转化最远的那个。
基于位置的归因模型,也叫U型归因模型,这种多触点归因方式其实是混合使用了First-Click和Last-Click的结果,简单可用。
U型归因模型实质上是一种重视最初带来线索和最终促成成交渠道的模型,一般它会给首次和末次互动渠道各分配40%的权重,给中间的渠道分配20%的权重,也可以根据实际情况来调整这里的比例。
U型归因模型非常适合那些十分重视线索来源和促成销售渠道的公司。该模型的缺点则是它不会考虑线索转化之后的触点的营销效果,而这也使得它成为销售线索报告或者只有销售线索阶段目标的营销组织的理想归因模型。
基于模型/数据归因,也叫DDA,Date-Driven Attributiton,即以模型或者说数据为依据的归因模型会根据每种转化类型的历史数据来分配转化功劳。该归因模型与其他归因模型的区别在于,它会使用帐号数据(如点击广告历史),确定哪些关键字、广告和广告系列对您的业务目标影响最大,计算每次触点的实际功劳。
该模型会通过对比转化客户和非转化客户的路径,从那些促成转化的广告互动中找出规律。路径中的某些步骤更有可能会促使客户完成转化。该模型会向客户路径上那些有价值的广告互动分配更多功劳。
这意味着,在评估转化数据时,您会看到哪些广告对您的业务目标影响最大。如果您借助自动出价策略来提高转化次数,该策略会利用这些重要信息帮您争取更多转化。
Google在2013年提出了DDA模型,并在次年AdWords中发布了该模型。下面是在Google Ads中以数据为依据的归因模型的运作方式介绍,有兴趣的可以看看: Google Ads data-driven attribution methodology
列举了当前DDA中会使用的一些典型的算法,关于具体逻辑和实现过程,大家可以根据兴趣再去关键字搜索。
关于DDA在目前国际一线互联网公司应用,谷歌系的产品用的是基于Shapley Value,但是要付费产品才可以使用。Facebook也有使用归因算法,但并未公布使用的具体算法是哪个,只是说定期更新算法模型。Adobe Analytics是基于Harsanyi Dividend。国内的有些公司使用的是Markov Chain。
优点:
缺点:技术要求&数据要求。需要较高的技术能力来搭建一套模型训练,同时也需要一定数量的数据来构建转化模型。因此在支持该类归因模型的平台,会自适应根据app历史数据是否满足来决定是否展示该类归因模型的选项。总体实现也较为复杂。下面是Google对数据的要求:
说了这么多的归因模型,具体使用的时候需要如何选择呢?记住:没有完美的归因,只有最适合的。因此,在选择使用哪种模型之前,我们需要先了解自己的业务模式。
那么现在,问题来了,我们再回过头来看上面的场景,张三好贵汽车下单的行为,应该归因给谁呢?
广义Deeplink,又叫深度链接,在不同厂家的产品中可能也有着很多种新的产品化名称,如AF的Onelink,字节的Zlink。Deeplink是一套链接服务,用户点击链接将会被引导到内容页,通过检测用户是否安装了相应的APP,用最短的用户路径打开指定的商品或内容页面,保证用户体验。当前已经频繁的应用于移动App的用户增长场景中(如拉新和活动推广)。
下面是一个普通链接和深度链接的示例区别:
深度链接:https://apps.apple.com/us/app/id1142110895
不是深度链接:https://apps.apple.com
广义 的DeepLink 涵盖两部分功能,分为 DeepLink 和 Deferred DeepLink。
指移动设备在已安装目标 App 的情况下,把特定的参数通过 url 的形式传递给 App,从而直接打开 App 的特定深度页面,实现从链接直达 App 内部页面的跳转。
指移动设备在没有安装目标 App 的情况下,用户点击链接时,引导用户前往下载安装 App,在其完成后,首次打开该 App 时自动跳转至 App 的特定深度页面。简单提一下实现方式,当跳转到应用市场去下载的这个过程中,会同时传递设备指纹信息给服务器,如果用户下载完后打开,会通过设备指纹做模糊匹配,然后直接打开相应的页面。
由此可见,DeepLink的出现,从用户角度,极大的优化了在使用App时候的体验,同时对于广告商来说,也可以提供更好的转化机会,提升拉新和促活的效率。
我们分别来看在ios和android生态下如何实现。
Universal Link是iOS操作系统在iOS9之后推出了基于http链接来打开app的功能。可以通过同一个地址,根据是否下载了该App来决定是打开网页还是直接打开app中的内容。从而为开发者建立更好的用户链接和体验。
App Links是安卓6之后推出的功能,开发者的App在支持Android App Links之后,可以使得用户访问直接来到应用内。
Deeplink这种技术通常运用于App社交分享、App广告引流、App裂变活动、Web to App、分享效果统计、沉默用户唤醒等场景,对广告引流、活动推广、新闻类、电商类、游戏类、视频直播类App的引流推广。而这些大部分的Deeplink中都会同时携带用于归因的参数。
为什么单独把设备ID拎出来说呢,因为设备ID是归因中最基础、最重要的标识,但同时,也是百家征伐的战场。 在归因中,不同的设备终端识别人的方式不同,但是基本原则都是通过尽量通过各种唯一的ID去作为人的唯一标识。
ID体系可以分为应用级别和系统级别,在涉及归因跟踪的时候,自然我们希望是根据系统级别、长期不变的一个ID去识别一个人。当前移动环境中,主要的生态就是IOS的Android,下面我们将分开来介绍其生态下各自的设备信息。
IOS是一个封闭的生态环境,我们能获取到什么、怎么去获取,完全看苹果的一系列决定或者心情。
应用级别
Universally Unique Identifier、通用唯一识别码。
当程序被卸载或重装后,获得UUID是不同的,但可以通过keychain去存储可以确保程序重装的时候不变,但当刷机或升级的时候还是会改变
Identifier For Vendor、应用开发商标识符
根据vendor的值,如果vendor相同,则返回同一字符串;如果vendor不同,则返回不同的字符串。适用于对内分析用户在应用内的行为等。
系统级别
International Mobile Equipment Identity、国际移动设备识别码。
相当于移动电话的身份证。早期的苹果是可以通过IMEI作为用户标识的,但是在iOS5以后就获取不到。
Media Access Control、硬件标识符。
MAC包括WiFi mac地址和蓝牙mac地址,iOS 7 之后被禁止。
全称是Unique Device Identifier、设备唯一标识。
它由40个字符的字母和数字组成。非唯一,iOS7中已经完全的禁用了它。iOS7之前的使用了的app如果在iOS7上运行,它不会返回设备的UDID,而是会返回一串字符串,以FFFFFFFF
开头,跟着identifierForVendor
的十六进制值。
Identifier For Advertising、广告标识符。
2012年,苹果在iOS 6 推出了IDFA,它是移动设备ID的一种,每一台苹果设备拥有一个IDFA,除非用户都对IDFA进行重置,否则将保持不变并独一无二。IDFA可帮助开发者更好地运行App内置广告,包括追踪和识别用户等,从而帮助品牌推送个性化的广告内容并获得广告收益。
此后MAC、UDID、UUID都被苹果给禁止,很长一段时间内基本上IDFA是一统天下。直到2020年苹果在全球开发者大会上详细介绍了iOS14的隐私选项,对IDFA的权限做调整,推出ATT,将IDFA从 OS 层面移至 app 层面。
应用级别
安卓系统下,对于应用级别I D使用的并不多
Vender Anonymous Device Identifier,开发者匿名设备标识符
Application Anonymous Device Identifier,应用匿名设备标识符
系统级别
同iOS的MAC,Android Q (安卓10)后禁止获取IMEI
同iOS的IMEI,由于安卓权限管理起步的较晚,目前还可以获取。但是Android Q 后就会禁止获取了。
Open Anonymous Device Identifier,匿名设备标识符
由中国信息通讯研究院号召,移动安全联盟(MSA)联合终端厂商(手机厂家)推出的团体标准,主要是为了加强对终端用户的隐私保护,应对Android Q操作系统禁止了非系统级应用对于设备识别码(IMEI、Device ID)的访问与获取。
ANDROID_ID在设备首次启动时,系统会随机生成一个64位的数字,并把这个数字以16进制字符串的形式保存下来,这个16进制的字符串就是ANDROID_ID。不同的设备,ANDROID_ID可能会相同;重置会导致ANDROID_ID不同。
GAID
GAID/AAID、Google Advertising ID/Android Advertising ID、Google广告ID
是谷歌对标苹果的IDFA的一个东西,但是需要结合Google的其他产品来使用,由于大陆地区使用不了,所以获取不到这个ID,这个ID对大陆地区的废的。
前面提到,Apple在WWDC20上发布了iOS14,同时也给我们带来了ATT和SKAdNetwork。
ATT是Apple推出的新的用户协议框架,全称AppTrackingTransparency,根据 Apple 的规则指南,任何出于跟踪或广告相关目的收集最终用户数据并与第三方分享的应用,都必须使用ATT框架。说白了也就是开发者获取用户的IDFA需要弹窗并经过用户的同意(App级别的权限,非设备级别),提高用户隐私透明度。而根据历史经验,至少40%的用户不会同意,如果用户拒绝数据跟踪,IDFA 就会返回一串 0。目前iOS上的广告生态中从定向到归因都是基于IDFA,影响之大可想而知。
同一时刻,为了解决ATT带来的问题,Apple自己又推出了解决方案:SKAdNetwork。你看,这就是闭环的可怕,自己锁起来,再自己造钥匙出来吆喝卖。1.0版本几乎无人问津,后面又出了2.0版本,多了些参数,下面是Apple官方给出的SK2.0流程图。(iOS14.6之后,已经升级到3.0)
下面是从流程上来看SkAd的一个流转:
无论如何,ATT和SKAdNetwork的出现,不仅代表着Apple更注重用户隐私透明度,也代表着Apple开始插手广告归因,想作为应用商店在广告归因中分一杯羹,并为未来更大的广告业务做准备。
SKAdNetwork的具体细节交互就不在这多说了,我们综合来看一些结论吧:
如上文提到的Branch ID,在这次iOS14之后,受影响最小的一个。这种方案本质上是寻找IDFA的替代品,难点有两个,唯一性和认可性。要有普遍的唯一性,是作为一个ID的必备能力。而且此方案要受到多方认可,才能够真正对外使用,否则只是另一个IDFV
这种方案是adjust提出来的(Adjust早期明确表示一定不做通用ID,不知道有无后悔)。首先,在广告主端的对广告主的IDFA和IDFV组成一个hash。然后,把这个hash和广告主的IDFV传到媒体APP客户端上。其次,在媒体本地上用媒体的IDFA和广告主的IDFV组成一个hash。最后,在媒体本地比较这两个hash是否一致。此方案就是认为这种方案不会以可识别的方式把IDFA发出去。Apple是否认为这种方案就是符合隐私要求的,这是要打个问号的。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。