大家好,我是邓飞。
前一段时间,一位统计学老师给我写了一封信,问了关于“组内观测次数不相等的多方差分析的多重比较”相关的问题:
N0的计算方法如截图所示:
下面这个公式和上面公式是等价的
这个问题很有意思,正常来说,平均数的计算直接用mean(n1,n2,n3)计算就行了,也有用算术平均数计算的:n/(1/n1 + 1/n2 + 1/n3),但是书中给出的却是上面的计算方法。
一、开始查阅资料
搜到了西安交大数学和统计学院的PPT:(https://gr.xjtu.edu.cn/c/document_library/get_file?folderId=2466728&name=DLFE-100423.pdf)
上面也是给出了n0的计算方法,但是没有说明原因。
另外,翻看教科书,《农业试验设计与统计分析》 王福亭,1991,p12,也给出了同样的公式:
翻了一些英文的教材,关于组内观测值不相等的方差分析,也没有找到相关描述。
二、为何要计算N0?
主要是多重比较,要计算两两之间的差数的标准误(sed),如果观测个数一样的话,直接就是sqrt(2*se^2 /n),这里n不一样,所以需要计算一个平均的n,就是n0了。
换一种思路,可以手动计算每两组的sed,这样就能得到每两组的值了,即用原始的观测值个数去计算,这样标准误就是下面的公式,可以看出,当n1=n2时,标准误SE = sqrt(se^2/n)。
三、用教科书的数据举个栗子
下面是5个不同品种的猪30天增重的数据,目的是分析不同品种的猪是否有显著性差异。
整理到Excel表格中:
为了方便计算se,sed,LSD,这里使用Genstat软件进行分析:
方差分析结果:
注意,教科书汇中的D组,求和应该为77.5,教科书计算为78.5,有误,所以教科书后面的结果不正确,这里我们手动计算一下。
由上面的方差分析表可知道,MSE为1.842,不同组的观测值个数为:
A:6
B:6
C:5
D:4
E:4
所以,se计算有四组,分别是6vs6 6vs5 6vs4 4vs4
有标准误se的公式可知:
6vs6的se为:0.554
6vs5的se为:0.581
6vs4的se为:0.619
5vs4的se为:0.643
4vs4的se为:0.678
对应的SED,再乘以sqrt(2),对应的LSD,再乘以对应的T值就行了。
软件结果:(se最小的为0.554,最大的为0.679,和上面手动计算结果一致)。
四、推荐结果
虽然,最后也没有找到平均数N0的计算来源,但是可以通过手动计算两两之间的se,进而计算sed和lsd,进行多重比较是没有问题的。
如果组数比较多,用软件计算就可以了。