我现在正在研究二进制文本分类问题(比如情感分析),仅仅通过feature_importances_
就能提取出xgboost或随机森林的重要特征是微不足道的
假设我们对这个分类问题有两个标签1和0。那么有没有办法打印出特征的方向(正的或负的)?比方说,单词特征A具有丰富或高tfidf,标签为1。
当然,我可以拉出这个特定单词特征的tfidf列,并与皮尔逊系数的标签相关联,系数的+/-将指示方向,对吗?任何其他更优雅的方式都内置了这样的函数。(我没有找到)
谢谢
https://stackoverflow.com/questions/58314707
复制相似问题