未知结果 :
① 挖掘结果 : 数据挖掘 挖掘出的知识是未知的 , 目的是为了发掘潜在的知识 , 模式 ; 这些知识只能在特定环境下可以接收 , 可以理解 , 可以运用 ;
② 知识使用 : 数据挖掘出的知识只能在特定领域使用...;
( 教科书上的标准描述 )
四、 决策树构造方法
----
递归 : 从 根节点 开始 , 从上到下递归 ;
分治 : 采用 分而治之 的方法 , 通过不断 将 训练样本 划分成子集 , 构造决策树...\rm T
中 样本类别相同 , 决策树只有一个叶子结点 ;
② 属性用尽 ( 递归停止条件 ) : 如果
\rm T
没有用于继续分裂的变量 , 则将
\rm T
中出现频率最高的类别作为当前节点的类别...训练集
\rm T
分为多个子集 ;
⑤ 标识根节点 : 使用
\rm X
标识当前结点 ;
⑥ 递归操作 : 对 ④ 中分割的多个子集执行 Generate_Decision_Tree 递归操作...,
\rm X
结点指向 这些递归操作生成的新的分支 ;
⑦ 返回当前的结点 ;
五、 K-Means 算法优缺点
----
K-Means 算法优点 :
① 处理大数据量有 可扩充性 和 高效率