特征工程:
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性
特征抽取
特征预处理
特征降维
1.特征抽取
1.1 字典特征抽取: 万能的0和1之字典特征抽取...他是不是只是从一个满是泥泞的臭水沟的监牢逃出而已?其实救赎是对自己的破茧成蝶,每个人眼前都有一个模版,一个完美的人的样子,很美,很有灵魂,很有姿态,得到很多人爱。为什么自己总是做不好,自己总是不美?...,缩放到特定的范围(一般为缩放到0至1之间),相当于把满分为100分转换成满分为1分,原来百分制能考95分,现在只能算作0.95分
原始数据 归一化后
[0, 0, 10] [0, 0, 0]
[3,..., 就容易影响准确性
2.2标准化
通过对原始数据进行变换,把数据变换到均值为0,方差为1范围内
rom sklearn.preprocessing import StandardScaler
# 标准化实例化对象...(尽可能损失较少的信息)
from sklearn.decomposition import PCA
def my_pca():
lee = [[10, 15, 20, 25],