01、数据挖掘方法论具体实施步骤
第一步:业务理解
指从业务角度来理解项目目标和要求,接着把这些理解知识转换成数据挖掘问题的定义和实现目标的最初规划。
第二步:数据理解
指从数据收集开始,然后接着是一系列活动,这些活动的目的是:熟悉数据,甄别数据质量问题、发现对数据的真知灼见、或者探索出令人感兴趣的数据子集并形成对隐藏信息的假设。
第三步:数据准备
指从最初原始数据构建最终建模数据的全部活动。数据准备很可能被执行多次并且不以任何既定的秩序进行。包括为建模工作准备数据的选择、转换、清洗、构造、整合及格式化等多种数据预处理工作。
第四步:建立模型
指选择和使用各种建模技术,并对其参数进行调优。一般地,相同数据挖掘问题类型会有几种技术手段。某些技术对于数据形式有特殊规定,这通常需要重新返回到数据准备阶段。
第五步:评估模型
指在此阶段,需要从技术层面判断模型效果以及从业务层面判断模型在实际商业环境当中的实用性。
第六步:结果部署
指即将其发现的结果以及过程组织成为可读文本形式或将模型进行工程化封装满足业务系统使用需求。
02、数据挖掘项目的成功要素
◆ 与业务价值目标紧密结合
◆ 合理确定项目范围—明确、可行
◆ 保证良好的数据质量
◆ 分析人员、业务人员、数据管理员、IT人员的有效配合
◆ 分阶段实施迭代式进行
◆ 公司高层的支持
◆ 高效的数据挖掘平台支撑
领取专属 10元无门槛券
私享最新 技术干货