我正在尝试apriori算法,它花费了比预期时间更多的时间,这是代码。
import pandas as pd
dataset = pd.read_csv("data.csv", header=None)
transactions = []
for i in range(0, 10):
temp = []
for j in range(0, 20):
temp.append(str(dataset.values[i,j]))
transactions.append(temp)
from apyori import apriori
associations = apriori(transactions, min_support=0.03, min_confidence=0.7, min_lift=3, min_length=2)
result = list(associations)
它可以很好地工作到创建先验对象的程度。但是,当我尝试运行最后一行(转换为列表)时,它花费了大量的时间。
正如您在上面看到的,我只输入了10个事务,但它输出了100多万条规则,因此我找不到代码中的错误。请帮我找到问题所在。
下图显示了anaconda spyder ide中的变量值。
谢谢你……
发布于 2018-07-31 19:48:47
将min_support
更改为min_support=0.003
,将min_confidence
更改为min_confidence=0.2
如果问题没有解决,请查看apriori.py
。
https://stackoverflow.com/questions/49656955
复制相似问题