ANOVA不同于之前的z检定,t检定,这里的零假设包含了很多个变量,具体是μ1=μ2=...=μn\mu_1=\mu_2=...=\mu_n。
t检定的核心思想是看样本检定值偏离理想值多远,如果足够远那么就不是因为取样误差造成的。 ANOVA的核心思想是:一个样本的variance可以归结于各种各样的factor,如果组间的variance确实比组内的variance大很多,一般3-10就认为大了,那么认为组件是有差异的。
前面的t统计量的使用情况大多是:
通过ANOVA的F检定,可以发现是否存在μi≠μj\mu_i \neq \mu_j。如果存在,那么下一步就是发现i,ji,j。 但是在这个过程中,会遇到错误累计的问题。也就是假设每对的单独t检定的Type I Error是α\alpha,那么如果进行k次检定,Type I Error是1−(1−α)k1-(1-\alpha)^k,如果kk很大,那这个值也很大。 也就是说,不能根据F检定的Type I Error去给每对在单独做同样Type I Error的t检定,每对t检定的Type I Error应该更小一点。