因此,我使用tfidf和count向量化器将此数据集转换为向量形式。结果,我得到了一个稀疏矩阵。我应用了决策树算法,得到了预期的结果。现在,我想准备另一个模型,在这个模型中,我只使用那些具有非零特征重要性的特征。但是,我无法过滤那些具有非零重要性的特征。<class 'numpy.float64'>'
with 7713590 stored elements in C
我正在使用sklearn的决策树分类器,但是我得到了100%的分数,我不知道出了什么问题。我已经测试了svm和knn,两者的准确率都在60%到80%之间,看起来也不错。using Decision tree classifier is {0:.8f}%".format(100* 这是输出:决策树分类器决策树分类<e