Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >购物篮分析:绝不只是“啤酒与尿布”!

购物篮分析:绝不只是“啤酒与尿布”!

作者头像
IT阅读排行榜
发布于 2018-08-14 03:37:20
发布于 2018-08-14 03:37:20
1.8K0
举报
文章被收录于专栏:华章科技华章科技

之前的两篇实用性文章《网购评论是真是假?文本挖掘告诉你》和《大数据助力东北小吃铺满血复活》发表之后,许多读者表示对其中的“购物篮分析”很感兴趣,希望我们能多做介绍。好吧,既然大家都这么有兴致,我就打开了亚马逊的页面,想找几本书推荐一下……

然后我发现,亚马逊的购书页面本身,正是购物篮分析的绝佳案例呀。

亚马逊将读者购买的所有书籍视作一个购物篮,分析篮子中某几本书同时出现的概率,比如买了《数据挖掘》之后再购买《R语言编程艺术》的条件概率和置信度等,然后据此向你推荐其他书籍,希望达到交叉销售的目的:

你一定由此立刻想到了诸多电商、视频网站的推荐链接,甚至搜索引擎展示的广告。其实购物篮分析的用途远远不止网络营销,它出现在我们生活的方方面面。你肯定听说过著名的“啤酒与尿布”吧——“购物篮分析”正是得名于一个相关的经典实例:超市对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买习惯,例如,购买产品X的同时也购买产品Y,于是,超市就可以调整货架的布局,比如将产品X和产品Y放在一起,以图增进销量。

关联规则挖掘中的关键概念包括

  • 支持度——X与Y同时被购买的概率;
  • 置信度——购买X后再购买Y的条件概率;
  • 提升度——先购买X对购买Y的概率的提升作用。

它们是鉴定关联规则的强弱指标,其中,支持度与置信度的高低可能有各种组合,也可以应用在各个领域。

当然,在实际工作中如要处理较为复杂的问题,关联规则挖掘往往要与其他方法或模型结合,才能达到更好的效果。在银行业或保险业的交叉销售工作中,关联规则几乎总是与客户分群相辅相成,毕竟,客户之间可能差别甚大,他们的购物篮里有什么,自然也千差万别;先对客户进行分群,再根据不同群组分别使用不同的关联规则进行营销,成功率会提升许多。

比如,我们现在面对着两位客户:王先生的年纪是45岁,家里有一位太太、两个女儿和三只猫,财务状况良好;李小姐27岁,单身租房独居,财务状况也良好。两位财务状况良好的人可能都在银行开了储蓄账户和信用卡账户,但接下来要做的事情恐怕不大可能一样,自然也不能向他们推销同一种产品。

应该做的,是进一步发现他们所在的客户分群,比如“家庭顶梁柱”或“单身女性精英”,然后进行更有效的交叉销售。王先生可能偏好家庭相关的保险产品,而李小姐也许更想开个贷账户,也可能是某些我们意想不到的产品。

在应用模型之前,客户经理们往往根据自己的业务直觉做出判断、进行营销,但有了各种模型之后,我们就可以以产品的关联规则为基础,再从客户群的角度分别分析其购买其他产品的可能性,从而对每一个客户都有对应的几种产品排序,而对在某产品中排名靠前的客户做营销。事实证明,这样的做法很有效用。比如,在某银行进行的项目中,对排名10%的客户进行营销,测试组比对照组对非寿险的营销响应率提升4倍,个贷则提升5倍。

测试组和对照组又是指什么呢?这就涉及到如何证明我们的模型和分析有效的问题。业绩的提升究竟是营销做得好、还是模型起作用?为了分清这一点,试点阶段中条件允许的话,最好分出测试组和对照组进行试验。测试组中,我们放入根据模型得到了前百分之若干的客户名单,而对照组则随机选取、或由客户经理根据营销经验选择。营销人员对于两组进行同等力度的营销,如果测试组的表现比对照组好,即可证明模型有效,这样的做法非常有说服力,人们忽视的真相战胜了本以为的“常识”。

购物篮分析的具体操作,则既可以用SAS Enterprise Miner实现,也可以使用R语言中的Apriori算法。

最后不妨再八卦两句“啤酒与尿布”的故事吧:一见到这几个字,我们马上就能脑补出一个骄傲的年轻父亲走进商场给孩子买尿布的场景。孩子出生前,他习惯周五晚上与哥们儿一起出去喝酒,现在可没机会了,但他还是惦记着过去的好时光,看见尿布边上的啤酒,忍不住买上一打回家畅饮,聊作安慰。

这个案例炒得轰轰烈烈,然而我至今似乎也没见过真的把啤酒和尿布摆在同一货架上的超市。事情的真相是,远在1992年,Teradata公司的一个团队针对某家连锁超市做了一次类似的购物数据分析,得出结论:下午5点至7点间,人们有同时购买啤酒和尿布的倾向。——没有提到性别、年纪或者日期,超市也压根没有利用这个结论,对货架进行任何调整。总之,啤酒与尿布与其说是个案例,不如说是个寓言童话。

然而,我们为何要在此提起这个已经屡遭夸大利用的故事呢?它当然不是毫无意义的。它的意义在于,此前从没有人想过啤酒和尿布之间能有什么关系,直到一次数据挖掘给你讲了个合情合理的故事。而关联规则挖掘、甚至所有数据挖掘工作正是如此:它是开放的,是没有偏见的,是你从来没想到的,但偏偏又切切实实地存在着。

这正是我们渴望完成的工作:从海量数据中寻找你意想不到的真相。

(作者:毕马威大数据挖掘,转载自公众号“ KPMG大数据挖掘”,转载请保留作者及公众号信息,谢谢。)

版权声明:转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。

大数据

我们将为大家提供与大数据相关的最新技术和资讯。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-03-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据DT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据案例:啤酒尿布的关联算法怎么来的?
故事背景: 在一家超市中,通过大数据分析发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品的销售数据曲线竟然初期的相似,于是就将尿布与啤酒摆在一起。没想到这一举措居然使尿布和啤酒的销量大幅增
小莹莹
2018/04/23
1.5K0
大数据案例:啤酒尿布的关联算法怎么来的?
【学习】数据挖掘典型应用:如何做好关联分析?
在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。而第二个指标提高Basket size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。 但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?去过零售商场的人都知道,经常看到不少组合的套装打包在一起优惠销售,例如P&G的产品:飘柔洗发水+玉兰油沐浴露、海飞丝洗发
小莹莹
2018/04/20
7650
机器学习|关联规则与购物篮分析实战
客户A企业是一家全球知名家具和家居零售商,销售主要包括座椅/沙发系列、办公用品、卧室系列、厨房系列、照明系列、纺织品、炊具系列、房屋储藏系列、儿童产品系列等约10,000个产品。为了维持顾客忠诚度、扩大销售,A企业希望通过顾客已有的购买记录,为顾客推荐更多的产品。请使用关联规则的方法,实现客户的需求。
数据STUDIO
2021/06/24
1.8K0
数据挖掘典型应用:如何做好关联分析
在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的: 第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size(即购物篮件数)。 第二个指标提高Basket size,就是让客户从以前只购买一件产品的转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。 但是如何挑出那些产品之间有关联销售的机会,从而形成相应的组合优惠套装呢?去过零售商场的人都知道,经常看到不少组合的套装打包在一起优惠销售,例如P&G的产品
机器学习AI算法工程
2018/03/13
1.7K0
数据挖掘典型应用:如何做好关联分析
手把手教你挖掘数据:怎样创造一个“尿布与啤酒”的都市传奇?
也有很多人对这个“传奇”的真实性表示怀疑,但如今看来,这个传奇已经并不神奇,它只是通过频繁项集进行数据挖掘的一个典型案例而已。
IT阅读排行榜
2019/05/13
6280
手把手教你挖掘数据:怎样创造一个“尿布与啤酒”的都市传奇?
数据挖掘相关联系著名案例——啤酒与尿布
前言 “啤酒与尿布”的故事是营销届的神话,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售、并获得了很好的销售收益,这种现象就是卖场中商品之间的关联性,研究“啤酒与尿布”关联的方法就是购物篮分析,购物篮分析曾经是沃尔玛秘而不宣的独门武器,购物篮分析可以帮助我们在门店的销售过程中找到具有关联关系的商品,并以此获得销售收益的增长! 商品相关性分析是购物篮分析中最重要的部分,购物篮分析英文名为market basket analysis(简称MBA,当然这可不是那个可以用来吓人的学位名称)。在数据分
小莹莹
2018/04/20
9.5K0
数据挖掘相关联系著名案例——啤酒与尿布
数据挖掘实战:关联规则挖掘及Apriori实现购物推荐
糖豆贴心提醒,本文阅读时间4分钟 这篇文章主要介绍三个知识: 1.关联规则挖掘概念及实现过程; 2.Apriori算法挖掘频繁项集; 3.Python实现关联规则挖掘及置信度、支持度计算。 希望这篇文章对你有所帮助,尤其是刚刚接触数据挖掘以及大数据的同学,这些基础知识真的非常重要。如果文章中存在不足或错误的地方,还请海涵~ 一. 关联规则挖掘概念及实现过程 1.关联规则 关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之
小小科
2018/05/02
3.2K0
数据挖掘实战:关联规则挖掘及Apriori实现购物推荐
购物篮分析
购物篮分析属于一种关联规则,是数据挖掘中非常流行的一种技术,购物篮分析有着广泛的应用,例如用于网络交易记录分析,视频推荐系统,购物推荐系统等。R 中实现关联分析可以使用 arules 包,里面包含了 apriori 算法与 eclat 算法等。
生信喵实验柴
2022/10/25
3830
从啤酒与尿布到关联规则
传说二十世纪90年代,美国沃尔玛超市的销售管理人员在分析销售订单时发现,啤酒与尿布这两件看起来毫不关联的商品竟然经常会出现在同一个订单中。后来跟踪调查发现,原来美国的年轻夫妇一般在周五晚上妻子会安排丈夫去超市购买尿布,而丈夫在购买尿布时总会忍不住顺便给自己买上几罐啤酒,这就是为什么啤酒和尿布这两件看起来毫不关联的商品经常会出现在同一个购物篮中。这个故事至今仍是大数据挖掘中津津乐道的经典案例。因为它揭示了数据中两个事物之间的关联性问题,也就是我们今天也重点介绍的——关联规则(分析)。
用户7569543
2020/07/17
1.3K0
关联规则(一):基本原理
参数化方法包括分类、回归等模型,优点是用少量的参数简化了建模问题,主要缺点是初始假设在许多实际问题中不成立,导致误差过大。
fireWang
2019/05/15
3.2K0
从原理到实现,详解基于朴素ML思想的协同过滤推荐算法
作者在《协同过滤推荐算法》、《矩阵分解推荐算法》这两篇文章中介绍了几种经典的协同过滤推荐算法。我们在本篇文章中会继续介绍三种思路非常简单朴素的协同过滤算法,这几个算法的原理简单,容易理解,也易于工程实现,非常适合我们快速搭建推荐算法原型,并快速上线到真实业务场景中,作为其他更复杂算法的baseline。
AI科技大本营
2019/09/25
6050
从原理到实现,详解基于朴素ML思想的协同过滤推荐算法
数据挖掘十大算法之Apriori算法「建议收藏」
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, CART
全栈程序员站长
2022/08/14
1.1K0
数据挖掘十大算法之Apriori算法「建议收藏」
《深度剖析:关联规则挖掘与SQL的奇妙融合》
在数据的浩瀚宇宙中,隐藏着无数有待发掘的秘密,关联规则挖掘算法便是探索这些秘密的有力工具。它不仅在学术领域大放异彩,在电商、金融、医疗等众多行业也发挥着至关重要的作用。本文将深入探讨关联规则挖掘算法的本质,并详细阐述如何借助SQL这一强大的数据处理语言进行关联规则挖掘。
程序员阿伟
2025/04/03
1230
《深度剖析:关联规则挖掘与SQL的奇妙融合》
让机器猜猜你喜欢的歌手-R关联分析
作者 CDA 数据分析师 关联规则挖掘是数据挖掘中成果颇丰而且比较活跃的研究分支。采用关联模型比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。 除此以外,关联规则挖掘还经常被用于: · 电信套餐的捆绑销售 · 歌曲推荐或者视频的“猜你喜
CDA数据分析师
2018/02/26
9260
让机器猜猜你喜欢的歌手-R关联分析
关联规则挖掘:Apriori算法的深度探讨
Apriori算法是一种用于挖掘数据集中频繁项集的算法,进而用于生成关联规则。这种算法在数据挖掘、机器学习、市场篮子分析等多个领域都有广泛的应用。
TechLead
2023/10/21
1.1K0
关联规则挖掘:Apriori算法的深度探讨
啤酒和尿布放在一起卖得更好?来看看这个故事背后的Apriori算法
Apriori算法号称是十大数据挖掘算法之一,在大数据时代威风无两,哪怕是没有听说过这个算法的人,对于那个著名的啤酒与尿布的故事也耳熟能详。但遗憾的是,随着时代的演进,大数据这个概念很快被机器学习、深度学习以及人工智能取代。即使是拉拢投资人的创业者也很少会讲到这个故事了,虽然时代的变迁令人唏嘘,但是这并不妨碍它是一个优秀的算法。
TechFlow-承志
2020/05/14
1.3K0
数据挖掘与建模
数据挖掘是基于统计学原理,利用机器学习中的算法工具实现价值信息的发现。机器学习是一种实现人工智能的方法,深度学习是实现机器学习的一种技术。
凹谷
2020/04/11
8470
R语言和数据分析十大:购物篮分析
提到数据挖掘,我们的第一个反应是之前的啤酒和尿布的故事听说过,这个故事是一个典型的数据挖掘关联规则。篮分析的传统线性回归之间的主要差别的差别,对于离散数据的相关性分析;
全栈程序员站长
2022/07/06
6720
R语言和数据分析十大:购物篮分析
数据挖掘快速入门
问题导读 1.什么是数据挖掘? 2.机器学习 与 数据挖掘在什么地方? 3.数据挖掘能解决什么问题? 1 数据挖掘 数据挖掘(Data Mining,简称DM),是指从大量的数据中,挖掘出未知的且有价值的信息和知识的过程。 2 机器学习 与 数据挖掘 与数据挖掘类似的有一个术语叫做”机器学习“,这两个术语在本质上的区别不大,如果在书店分别购买两本讲数据挖掘和机器学习的书籍,书中大部分内容都是互相重复的。具体来说,小的区别如下: 机器学习:更侧重于技术方面和各种算法,一般提到机器学习就会想到语音识别,
用户1410343
2018/03/27
1K0
数据挖掘快速入门
Thinking in SQL系列之数据挖掘Apriori关联分析再现啤酒尿布神话
编辑手记:SQL做为一种编程语言,能够满足各类数据处理的需要,关键就在于算法与思维方式。以SQL会友,希望结交更多的数据库、数据分析领域的朋友。 作者简介:牛超 10多年数据库技术积累,长期从事OR
数据和云
2018/03/07
1.5K0
Thinking in SQL系列之数据挖掘Apriori关联分析再现啤酒尿布神话
推荐阅读
相关推荐
大数据案例:啤酒尿布的关联算法怎么来的?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档