我有一个由数百个分类变量组成的数据集,只使用features_categorical = features_old.select_dtypes(exclude=["number"])选择了分类变量类别出于特征工程的目的,我需要使用此方法拆分具有5个以上类别的类别 In : features_categorical['Variable 1'].unique()
Out : array(['Category_1',
我正在尝试使用两个特性在lightgbm中创建一个简单的模型,一个是分类的,另一个是距离。我遵循了一个教程(),该教程指出,即使在LabelEncoding之后,我仍然需要告诉lightgbm,我的编码功能本质上是绝对的。我想知道的是lightgbm是否真的理解这个专栏在本质上是绝对的。它看起来是这样的,但是我不确定为什么教程中明确地说明了它没有。下面是我的代码:
trainDataProc = p