数据挖掘(Data Mining)是对在正常业务过程中积累的数据进行选择和分析,以发现和确认之前未知的关系,这些关系可以在应用于新数据时,可以预测模型,并产生积极和可验证的结果。数据并不新鲜。我们不是为了做某种实验而创建这些数据。数据是出于商业原因收集的,而并非为了测试各种假定。 这些未知的假定也许总所周知,但是,我们需要数据来证明这些假定。 数据必须有用,并必须服务于商业事务中的一个目的,而且它必须能够应用到新的数据。一旦数据模型建立,我们可以定期的在模型中应用新数据,基于获得评分,可以指导采取不同行动措施。数据挖据涉及统计分析,统计分析,假设验证,商业智能汇报,数据分析等。
当大多数分析人员尝试构建预测模型时,他们通常不加批判地接受研究要求,然后不加批判地接受数据,然后应用到他们选择的建模工具并开始建模。 差的问题定义几乎肯定是项目失败的最大原因。那么第一件要做的事是将商业目标转化为每一个具体的是与非。数据挖掘并不是漫无目的的搜索,而是为做某些具体决定实现目标的探索。而一旦模型建立,这模型必须能帮助商业上的决策。
领取专属 10元无门槛券
私享最新 技术干货