我使用管道模块在火花放电中实现DecisionTreeClassifier,因为我有几个特性工程步骤要在我的数据集上执行。(labelCol="indexedLabel", featuresCol="indexedFeatures")
pipeline(prediction, true label) and compute test error
ev
我正在使用Numpy作为dataset加载一个csv,以便在Python中创建决策树模型。使用下面的提取将0-7列放置在X中,最后一列作为Y中的目标。identify columns as data setsclf = tree.DecisionTreeClassifier()我想知道的是,是否可以在任何列中