在scikit-learn中,对数值目标变量进行有效编码可以使用LabelEncoder或OneHotEncoder。
from sklearn.preprocessing import LabelEncoder
# 创建LabelEncoder对象
encoder = LabelEncoder()
# 将目标变量进行编码
encoded_target = encoder.fit_transform(target)
# 打印编码后的目标变量
print(encoded_target)
from sklearn.preprocessing import OneHotEncoder
# 创建OneHotEncoder对象
encoder = OneHotEncoder()
# 将目标变量进行编码
encoded_target = encoder.fit_transform(target.reshape(-1, 1))
# 打印编码后的目标变量
print(encoded_target.toarray())
在以上示例代码中,target
是包含目标变量的数组。使用LabelEncoder时,可以直接调用fit_transform
方法对目标变量进行编码,并使用fit_transform
方法返回编码后的结果。使用OneHotEncoder时,需要先调用fit_transform
方法对目标变量进行编码,并使用toarray
方法将编码后的结果转换为数组形式。
对于scikit-learn中的其他编码方法和相关概念,可以参考官方文档:Preprocessing data。
领取专属 10元无门槛券
手把手带您无忧上云