三世烟火,一生迷离
——侃爷
这是最近找机器学习实习的一个笔试题:
看到这个题的时候第一想法就是用关联规则(Apriori算法)来实现。
关联规则最重要的就是支持度Support和置信度Confidence。
支持度的计算方法:
置信度的计算方法:
知道支持度和置信度的计算方法之后就可以实现上面算法了,首先本题给的数据集比较大,有六百多个项,因此直接对数据进行循环操作的话时间复杂度太高,我们先根据支持度对数据进行基本筛选。
因此我们先找出规则左边只有一项且满足支持度的数据,即初步剔除不满足支持度的数据,代码如下:
然后根据通过双层循环来选取满足置信度条件的规则,其中在左边有两项的规则中需要加入支持度条件,代码如下:
到这里就基本完成了这个机器学习的笔试题。
好看比赞赏重要!!!
领取专属 10元无门槛券
私享最新 技术干货