模型泛化.png
训练和测试数据分割
// 导入训练和测试数据分割函数
from sklearn.model_selection import train_test_split
//分割数据,将 30% 数据分割至测试集
train, test = train_test_split(data, test_size=0.3)
//其他的数据分割方法:
from sklearn.model_selection import ShuffleSplit
交叉验证
// 导入训练和测试数据分割函数
from sklearn.model_selection import cross_val_score
// 使用指定的模型实施交叉验证
cross_val = cross_val_score(KNN, X_data, y_data, cv=4, scoring='neg_mean_squared_error')
// 其他的交叉验证方法:
from sklearn.model_selection import KFold, StratifiedKFold
线性回归简介.png
线性回归
// 导入包含回归方法的类
from sklearn.linear_model import LinearRegression
// 创建类的实例
LR = LinearRegression()
// 在数据上对实例进行拟合,然后预测期望值
LR = LR.fit(X_train, y_train)y_predict = LR.predict(X_test)
高级线性回归.png
// 导入包含转换方法的类
from sklearn.preprocessing import PolynomialFeatures
// 创建类的实例
polyFeat = PolynomialFeatures(degree=2)
创建多项式特征,然后转换数据
polyFeat = polyFeat.fit(X_data, y_data)
x_poly = polyFeat.transform(X_data)