文章目录
一、 数据挖掘特点
二、 数据挖掘组件化思想
三、 朴素贝叶斯 与 贝叶斯信念网络
四、 决策树构造方法
五、 K-Means 算法优缺点
六、 DBSCAN 算法优缺点
七、 支持度 置信度..., 趋势分析 等 ;
③ 评分函数 : 误差平方和 , 最大似然 , 准确率 等 ;
④ 搜索和优化方法 : 随机梯度下降 ;
⑤ 数据管理策略 : 数据存储 , 数据库相关 ;
1 ....数据管理策略 : 传统数据与大数据 ; 设计有效的数据组织与索引技术 , 通过采样 , 近似等手段 , 减少扫描次数 , 提高数据挖掘算法效率 ;
① 传统数据 ( 内存管理数据 ) : 传统的数据管理方法是将数据都放入内存中...聚类速度快 ;
DBSCAN 算法缺点 :
① 输入参数
\varepsilon
和
\rm MinPts
的值比较难确定 ;
② 数据库中 数据对象密度分布不均匀 时 , 使用相同的参数值可能无法得到好的聚类结果...----
给定
\rm X , Y
两个项集 , 并且有
\rm X \geq Y
;
支持度 :
\rm X \Rightarrow Y
的支持度是
\rm X , Y
两个项集在数据库