在模型的训练过程中,我已经使用了shuffle my dataset,如文档示例: (但无法将其全部混洗,因为它会占用太多内存),我还将我的数据集分成多个小碎片,每个碎片大小相等。然而,我有理由认为这种“近似”的混洗是不够的,我还认为馈送已经混洗的数据将提高训练速度。所以现在我的问题是:在我将我的数据集分成Tf
我正在尝试理解如何使用交叉验证函数sklearn.model_selection.KFold。如果我定义(就像在这个tutorial中) from sklearn.model_selection import KFold
You should leave random_state to its default (None),