我试图做一个交叉验证,但我想删除异常值(例如。仅低于0.95y)的训练集,同时保持完整的测试集。我正在使用:
cv_scores = cross_validate(reg, X=X, y=y_tr, cv=GroupKFold(n_splits=3), groups=groups, scoring=scoring, return_train_score=True, verbose=0)
但是,对于交叉验证(来自sklearn.model_selection的函数),我不知道如何进行必要的更改。
示例:
date id x1 x2 y
1 a 10 15 100
2 a
我有追踪某种眼睛现象的数据。有些患者双眼都有,有些患者只有一只眼。下面是一些数据的样子:
EyeID PatientID STATUS Gender
1 1 1 M
2 1 0 M
3 2 1 M
4 3 0 M
5 3 1 M
6 4 1 M
7 4 0 M
8 5 1 F
9 6 1 F
10 6 0 F
11 7 1 F
12 8 1 F
13 8 0 F
14 9 1 F
正如你从上面的数据中看到的,总共有9名患者,他们