2、均值归一化
均值归一化是指通过原始数据中的均值、最大值和最小值来进行数据的标准化。...4、向量归一化
向量归一化是指通过用原始数据中的每个值除以所有数据之和来进行数据的归一化。...2、等宽分组
等宽分组的原理是,根据分组的个数得出固定的宽度,分到每个组中的变量的宽度是相等的。
例如,将一组变量(1,7,12,12,22,30,34,38,46)分成三组。...例如,将一组变量(1,7,12,12,22,30,34,38,46)分成三组,去重后,变量个数为 8,所以该组变量的分组数目为 8。...所以,基于信息熵进行数据分组的具体做法是:
1、对属性
的所有取值从小到大排序
2、遍历属性
的每个值
,将属性
的值分为两个区间
、
,使得将其作为分隔点划分数据集后的熵