特征提升特征抽取使用CountVectorizer并且不去掉停用词的条件下,对文本特征进行量化的朴素贝叶斯分类性能测试使用TfidfVectorizer并且不去掉停用词的条件下,对文本特征进行量化的朴素贝叶斯分类性能测试...,我们可以知道,使用CountVectorizer在不去掉停用词的条件下,对训练和测试文本进行特征量化,并利用默认配置的朴素贝叶斯分类器,在测试文本上可以得到83.977%的预测准确性。...,可得出结论:在使用TfidfVectorizer而不去掉停用词的条件下,对训练和测试文本进行特征量化,并利用默认配置的朴素贝叶斯分类器,在测试文本上可以得到比CountVectorizer更加高的预测准确性...最后,再使用下面的代码继续验证另-一个观点:“这些停用词在文本特征抽取中经常以黑名单的方式过滤掉,并且用来提高模型的性能表现”。...使用Titanic数据集,尝试通过特征筛选来寻找最佳的特征组合,并且达到提高预测准确性的目标。