首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大白话大数据系列:相关分析方法

今天我们来讲讲分析方法的相关系数

定义

相关分析方法的定义就是利用指标衡量两种数据间的相关程度。

1)数值大小表示两种数据的相关程度:

相关系数的绝对值越大,说明两种数据的相关程度越高。

弱相关:0~0.3

高度相关:0.6~1

2)数值正负反映两种数据的相关方向:

-:反方向变化,负相关,一种数据增大,另一种数据随之减小

+:同方向变化,正相关,一种数据增大,另一种数据随之增大

0:不是线性相关

应用场景

比如说一个APP的日活量下降,经过假设检验分析,我们了解到日活量下降的原因有三个:

1.获取用户的渠道B出现了问题

2.产品出现了闪退等问题

3.竞品对手开始了大额补贴

这三个问题都很棘手,都急需解决。但是因为公司的资源有限,只能优先解决一个问题,那么哪个问题是最优先的呢?

这里就要用到相关系数分析,我们分析后发现问题2.产品出现了闪退和日活量下降相关系数最高,所以我们知道了解决闪退问题是最优先的了。

注意事项

相关关系我们很容易和因果关系相混淆。

因果关系往往是A事件导致了B事件

相关关系是A事件发生的同时,B事件也发生了,但是我们不能说A事件的发生导致了B事件的发生。

实际上,相关关系的发生要么是有个C事件的发生导致的,要么是纯属巧合。

那么,怎样判断是因果关系还是相关关系呢?

单一控制变量法即可,对,就是初中学的那个!~!

举个栗子:每天早上,公鸡都会打鸣,太阳都会升起。那么这两者之间是啥关系呢?

我们把公鸡炖了,太阳依然会照常升起。

所以这不是因果关系,属于相关关系。

CTR技术建立在相关关系分析的基础上的,大部分时候我们往往无法找到直接的因果关系,当必须找到原因时:先找到相关关系,再通过实验找到因果关系

最后打个小广告,我的微信公众号:顾先生的数据挖掘

喜欢的小伙伴可以关注下,你的关注是我最大的动力!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200512A0CXF200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券