,可以通过以下步骤完成:
library(sparklyr)
spark <- spark_connect(master = "local")
data <- sdf_copy_to(spark, transactions, name = "transactions", overwrite = TRUE)
model <- ml_fpgrowth(data, items_col = "items", freq_items_col = "freqItems", min_support = 0.1, min_confidence = 0.5)
在上述代码中,"items"是包含事务项的列名,"freqItems"是输出频繁项集的列名。min_support和min_confidence分别是支持度和置信度的阈值,可以根据实际需求进行调整。
freq_items <- extract(model, "freqItems")
assoc_rules <- extract(model, "associationRules")
show(freq_items)
show(assoc_rules)
以上是在Sparklyr中使用ml_fpgrowth选择支持度和置信度的基本步骤。关于Sparklyr和ml_fpgrowth的更多详细信息,可以参考腾讯云的相关产品和文档:
领取专属 10元无门槛券
手把手带您无忧上云