决策树的生成:
ID3算法:核心是在决策树各个结点上应用信息增益准则选择信息增益最大且大于阈值的特征,递归地构建决策树.ID3相当于用极大似然法进行概率模型的选择.由于算法只有树的生成,所以容易产生过拟合...剪枝算法:剪去某一子结点,如果生成的新的整体树的损失函数值小于原树,则进行剪枝,直到不能继续为止.具体可以由动态规划实现....改进的迭代尺度法(IIS):假设当前的参数向量是w,如果能找到一种方法w->w+δ使对数似然函数值变大,就可以重复使用这一方法,直到找到最大值.
逻辑斯谛回归常应用梯度下降法,牛顿法或拟牛顿法....,根据拉格朗日对偶性,原始问题的对偶问题是极大极小问题:
?
.先求对w,b的极小值.将L(w,b,a)分别对w,b求偏导数并令其等于0,得
?
,代入拉格朗日函数得
?...选择一个新的样本点作为新的质心,选择原则是D(x)越大的点被选中的概率越大.
重复2和3直到选出k个质心.