在Python中,可以使用train_test_split
函数从数据集中排除训练集。该函数是scikit-learn
库中的一个常用函数,用于将数据集划分为训练集和测试集。
train_test_split
函数的使用方法如下:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
其中,X
是特征数据集,y
是目标变量。test_size
参数指定了测试集的比例,可以根据需求进行调整。random_state
参数用于设置随机种子,保证每次划分的结果一致。
train_test_split
函数会返回四个数据集:X_train
为训练集特征数据,X_test
为测试集特征数据,y_train
为训练集目标变量,y_test
为测试集目标变量。
使用train_test_split
函数可以方便地从数据集中排除训练集,以便进行模型训练和评估。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云