本章我们要讨论一种简单的非线性模型, 用来解决回归与分类问题, 称为决策树(decision tree)。首先, 我们将用决策树做一个广告屏蔽器, 可以将网页中的广告内容屏蔽掉。...在分类任务中, 包含在叶子节点中的样本响应变量的值的平均值作为响应变量的估计值。决策树建立之后, 做决策的过程就是把测试样本放进决策树沿着边不断前进, 直到一个叶子被触及才停止前进。...这个分类器发现了测试集中90%的广告, 真广告中有88%被模型发现了, 你运行的数据结果可能会有不同。分类器的效果还可以,下面我们进一步改善模型的效果。...首先,决策树对数据没有零均值,均方差的要求。而且可以容忍解释变量值的缺失,虽然现在的scikit-learn还没实现这一特点。决策树在训练的时候可以忽略与任务无关的解释变量。...另外,决策树支持多输出任务,单一决策树可以用于多类分类,不需要使用one-versus-all策略。