首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据时代,没人替你守口如瓶

随着云时代来临,大数据(Big Data)越来越多地被关注。数据在迅速膨胀过程中,已经逐渐渗透到学术、商业、政府、经济等领域,这种基于大数据分析的决策影响着企业和业务发展,它比经验和直觉更加准确。

大数据的商业价值

在互联网行业,互联网公司将通过各种来源实时搜集的庞大数据组进行集中存储和集中分析,包括每个人线上、线下留下的姓名、电话、邮箱、性别、地址、兴趣、需求等,这些数据主要来自于社交网络、电子商务网站、其他各种渠道,乃至大量黑市数据。电商平台可以根据客户购买商品的价位等级、收货地址的房价推算客户的收入水平,社交平台可以根据客户社交好友的等级分布推算客户的社会阶层……

举个例子,Google,成立于大数据时代的互联网公司。Google的产品全部是免费使用的,例如: Gmail、Google+、联系人、以及Android系统,那么Google是如何实现长期盈利的呢?在联网使用Google时,用户的相关信息便实时被Google记录下来。随着它对用户的信息掌握的越多,便针对不同客户推送不同的广告,以此盈利。

大数据时代根本没有秘密,你悄悄搜了啥,他们都知道。

Target,作为一个大数据分析卓越的零售超市,曾接到一个投诉电话,因为Target公司送给客户未成年的女儿避孕药品类折扣券,不久后,这位生气的客户自己跑来道歉,因为他的女儿真的怀孕了,而Target则是基于女性怀孕后的生活习惯改变,浏览、购买不同的东西。同样,婚姻满意度、身体健康状况等各个方面,可能你自己都没意识自己的变化,大数据已经知道了。

大数据的核心

大数据巨大的规模性:大数据是在大规模数据的基础上做到的事情,是通过对海量数据进行分析,获取有效信息。数据根据级别可分为B、KB、MB、GB、TB、PB、EB、ZB等,而只有PB级别才能称为大数据。

大数据处理的快速性:由于数据和信息更新速度非常快,信息价值存在的时间也非常短,因此便需要大数据的处理速度越来越快速。在非常短暂的时间内,将海量大数据里的无用信息进行筛除处理,搜集能够利用的信息。

大数据的预测性:通过对海量大数据进行分析,整理事物间错综复杂的关系,能够有效的对事件趋势进行预测。

大数据风控

所有的大数据风控,都是依靠强大的计算能力,计算用户之间相关性。大数据风控经常提及的便是模型和数据。

目前,模型有很多,例如一般线性回归、logistic回归、基因遗传最大似然非线性模型、神经网络、深度学习。在建模过程中,第一步收集数据,主要是业务、爬虫、三方、行为数据;有了数据,便可以多维度刻画用户,称为特征工程;之后便是建立信用模型和欺诈模型,上线运营,并通过新数据和新特征对模型进行升级迭代。

大数据风控的核心,其实是数据。许多小型互金平台总是标榜自己的风控模型,然而,模型可以不行,数据一定要准。大数据风控中的数据同样遵从二八法则,20%的数据贡献80%的价值,数据、样本并非越多越好。在数据分析前,经常需要耗费大量时间进行特征清洗,即异常值的清洗。数据不准确,模型便没有调优的必要。

作为这个信息爆炸时代的产物,大数据有你想象不到的好,也有你想象不到的恶。它在提高企业效率的同时,偷窥每个样本动态,窃取信息,将每个人背地里的那点秘密抖落出来,无情杀熟。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180521G1PKN100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券