首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

浅谈数据分析

前略

最近有程序猿小伙伴卖萌说不知道什么叫数据分析,并且发现了对数据分析的一些误解。今天为大家科普下吧~当然,我也基本算个小白,有不对的地方欢迎补充。

首先,先说下现在大家经常接触到的数据分析。其实,数据分析只是数据处理的一部分,但是由于分析后会有结果的产生,所以普遍被大家认识到的就是数据分析。

其实关系应该如下图:

数据分析只是其中的一个环节,其实数据分析对于数据量很小的标本是没有意义的。只有当数据量很大的时候,通过寻找数据的相似性,从而去进行分析。其实,就是通过大数据去寻找相应的共性、关联,从而去佐证自己在分析前的设想。

其实,这不得不说一下正常科学研究的方法了。数据在我看来可以算是实验的一种,做实验之前有两种可能一种是有假设通过实验去验证假设,一种是有实验的一定目的性通过实验去发现问题。

这与使用数据分析是一样的,数据为什么分析?怎么样去分析?结果是怎样?

可以说,我们在做数据分析的时候也会存在两种情况,①有个想法去验证②从数据中找共性从而去发现想法

这本身就是数据研究的两个方向,也是除了数据分析师之外的产品经理需要做的工作。

对于两种情况举个栗子(因为我原来做风控的就拿风控举例了):

①有个想法去验证

在风控上,区分好人和坏人、人还是机器人是对于反作弊来说比较重要的一点。那么坏人的共通点有什么呢?如果知道相关的关系型我是否就能快速判断坏人呢?这里不得不说关系型网络的一个概念,我们可以普遍认为近朱者赤近墨者黑这句话算一部分的真理。那么对于借钱这点,可以说坏人会连成线,好人可能是单点的。有了这个想法之后,就可以为数据组去提交相应的维度进行验证了。

1、对于数据的注册时间、地区关系进行统计

2、对于用户的通讯录信息进行分析(比如姓名、号码是否重复多次出现)

3、用户通话详单分析

4、逾期数据

通过以上几个维度,去验证是否坏人是否是连成片的,如果验证通过,那么在以后的风控策略上就可以对于这个点作为风控点去进行记录。

②从数据中找共性从而去发现想法

这个比较有趣了就,需要数据人员对各个维度的数据清洗后,对关键点进行一定聚类,从而去寻找相应共性。再对共性进行回归验证一下,是否这个共性为有效的,如果是,则可以作为风控策略。

其实,分析方法有很多种,比较常用的就是聚类,但是聚类比较适合用于单因子决策。如果是多因子来说,那就需要对其单因子、关系型因子分析了。其实数据分析后,对于已经成熟的产品的改进方向是重要的,现在一个成熟型的产品,除了增加相应的新功能外,其实更应该由数据驱动进行产品迭代。

我这里举个栗子,也是我平时槽点众多对象之一:

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180327G1BIRS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券