前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

作者头像
拓端
发布2025-04-15 13:44:27
发布2025-04-15 13:44:27
8300
代码可运行
举报
文章被收录于专栏:拓端tecdat拓端tecdat
运行总次数:0
代码可运行

原文链接:http://tecdat.cn/?p=26999

Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出点击文末“阅读原文”获取完整代码数据)。

它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。

相关视频

最强大的应用程序之一是我们在亚马逊上在线购物时看到的推荐系统 - 以及当今几乎所有电子商务网站上都存在的各种其他版本。

这是为了帮助理解一个非常简单的数据集查看文末了解数据获取方式,其中包含单个国际标准书号 (ISBN),它是一本书的唯一国际出版商标识符号。每行代表购买了所列书籍的唯一客户。

目标是了解基本购买行为,向客户推荐的其他书籍是什么——这样它可以提高公司的收入以及对所提供服务的整体满意度。

我们以网络图结束,该图展示了置信度高于 55% 的关系。

设置和导入数据集

代码语言:javascript
代码运行次数:0
运行
复制
import numpy as np

import pandas as pd



data.head()
代码语言:javascript
代码运行次数:0
运行
复制
data.shape

数据集上的EDA

代码语言:javascript
代码运行次数:0
运行
复制
#执行堆叠的步骤,转换为字符串,包括删除索引

dt2 = pd.DataFrame

dt2 = dt2.reset_index(drop = True)
代码语言:javascript
代码运行次数:0
运行
复制
dt2.nunique()  # 总共有4,999本独特的书籍
代码语言:javascript
代码运行次数:0
运行
复制
#数据集中购买最多的前10本书

top0 = pd.DataFrame(dt2.value_counts(sort= True, ascending=False).head(10))

to10
代码语言:javascript
代码运行次数:0
运行
复制
# 创建条形图 

plt.bar(t0.index, top_10\['Frequency'\])

预处理

代码语言:javascript
代码运行次数:0
运行
复制
tdf= t.fit(d2).transform(da2)
代码语言:javascript
代码运行次数:0
运行
复制
ted= t.fit(r).transform(tr)

t_f
代码语言:javascript
代码运行次数:0
运行
复制
tdf= df.astype("int")



t_f
代码语言:javascript
代码运行次数:0
运行
复制
oks = d.DataFrame(tf, columns=e.columns_)

bos.head()

建立Apriori模型

代码语言:javascript
代码运行次数:0
运行
复制
runets = apriori(o2, min\_support=0.01, use\_colnames=True)
代码语言:javascript
代码运行次数:0
运行
复制
feqts
代码语言:javascript
代码运行次数:0
运行
复制
fetes.sort_values( by = \['support'\] ,ascending = False)
代码语言:javascript
代码运行次数:0
运行
复制
rls  =  assoc(fret, metric = "lift", min_threshold = 1)
代码语言:javascript
代码运行次数:0
运行
复制
re.solues('confidence', ascending = False)

ruls.head()
代码语言:javascript
代码运行次数:0
运行
复制
rul = rls\[res\['confidence'\] >= 0.55\]

rue

结论网络图

代码语言:javascript
代码运行次数:0
运行
复制
fig, ax = plt.subplots(figsize = (10,6))

G = x.from\_pandas\_edgelist(ul,source = 'antecedents')

n.draw(A)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 拓端数据部落 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 原文链接:http://tecdat.cn/?p=26999
  • 设置和导入数据集
  • 数据集上的EDA
  • 预处理
  • 建立Apriori模型
  • 结论网络图
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档