将事务数据表中的各个事务对应的数据项按照支持度排序后,把每个事务中的数据项按降序依次插入到一棵以 NULL为根节点的树中,同时在每个结点处记录该结点出现的支持度。
...假设存在的一个事务数据样例为,构建FP树的步骤如下:
事务ID 事务中的元素
001 r,z,h,j,p
002 z,y,x,w,v,u,t,s
003 z
004 r,x,n,o,s
005 y,r...结合绘制的带头指针表的FP树,对表中数据进行过滤,排序如下:
事务ID 事务中的元素 过滤和重排序后的事务
001 r,z,h,j,p z,r
002 z,y,x,w,v,u,t,s z,x,y,s,t...从FP树中挖掘频繁项集
在构建了FP树之后,就可以抽取频繁项集了,这里的思想和Apriori算法大致类似,首先从氮元素项集合开始,然后在此基础上逐步构建更大的集合。...结合构建FP树绘制的图,r的前缀路径就是{x,s}、{z,x,y}和{z},其中的每条前缀路径都与一个计数值有关,该计数值表示的是每条路径上r的数目。