print("在测试集中,我们有", test_df.shape[0], "个观察值和", test_df.shape[1], "列/变量。")...print("在商店集中,我们有", store_df.shape[0], "个观察值和", store_df.shape[1], "列/变量。")...在训练集中,我们有1017209个观察值和9列/变量。
在测试集中,我们有41088个观测值和8列/变量。
在商店集中,我们有1115个观察值和10列/变量。
首先让我们清理 训练数据集。...StateHoliday, dtype: int64
train_df.StateHoliday_cat.count()
1017209
train_df.tail()
train_df.isnull().all() #检查缺失...因此,我建议用零填充缺失的值。
store_df["CompetitionOpenSinceMonth"].fillna(0, inplace = True)
让我们看一下促销活动。