前面八章介绍了R软件的基础知识,这些知识都是零碎的操作与处理,虽然不能处理一个完整的实际案例,但却非常重要,接下来,主要讲数据挖掘中处理实际案例之前,所需要的一些模型和功能,我们先从传统的统计学开始,然后到数据挖掘算法...结果分析:画红线是我标上去的,1.分别是t检验量,自由度,和P值 2.95%的置信区间 3.两组数据的平均值
P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。...如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。...这里是0.96比较高,就接受原假设咯. t值在置信区间内我们就暂且相信原假设了.....若不知道总体是否服从同一分布,但两组样本独立 则 wilcox.test( 样本1数据,样本2数据 )
若不知道总体是否服从同一分布,且两组样本不独立,则 wilcox.test( 样本1数据,样本2