卡方检验检出组间差异后,得到的结果只能显示行变量与列变量间是否相互独立,但各变量的不同组别间具体存在何种差异呢?这需要后续通过两两比较来得到更为精确的结论。下面,我将用一个简单的案例向大家演示:在SPSS中卡方检验如何进行两两比较,以及如何解读输出结果。
注意:卡方检验的事后两两比较只适用于检验交叉表的列方向对应的变量水平数大于等于3的卡方检验;即用于3个或3个以上率的两两比较。
1、案例数据
在雨伞制造厂中,会对雨伞手柄进行测量,如果雨伞手柄不符合规格,则会从装配线中将其移除。每日报表将显示在所有三个班次期间,工厂的三台冲床中每台生产的不合格手柄数。质量工程师想确定冲床和班次是否存在关联?三台冲床生产的不合格手柄数是否不同?
上表中,机器ID分别显示3台冲床,班次分别显示3个不同班次,两个变量都为无序分类变量。频率表示每台冲床不同班次生产的不合格手柄数。很明显,这个案例需要用到卡方独立性检验方法。
2、个案加权
因为本文提供的案例数据是汇总数据而不是明细数据,因此在开展卡方检验之前,首先需要对频数变量进行加权,在菜单栏选择数据->个案加权,将频率变量选入对应的分析框中,点击确定。对话框如下图所示:
3、卡方检验与事后两两比较
(1)选择分析->描述统计->交叉表;
(2)将班次选入“行”列表框,将机器ID选入“列”列表框;
注意:如需进行两两比较,需要将比较的分组变量置于列方向。
(3)在统计子对话框:勾选卡方;
(4)在单元格子对话框:勾选比较列比例、调整p值(邦弗伦尼法),以及列百分比;
5)点击确定。
注意:
第4步骤为两两比较的关键步骤;
列百分比表示:不同冲床机器生产的有缺陷的把手数量占该机器在当天三个班次生产的所有有缺陷把手数量的百分比;
4、结果分析
案例中使用 Pearson 检验和似然比检验来确定机器和班次之间是否存在关联。由于 Pearson 检验和似然比检验的p值为0.019(<0.05),因此可以断定机器ID变量和班次变量之间存在关联。
交叉表中显示了不同冲床机器和不同班次生产的有缺陷把手的数量;同时,表格中会以字母下标格式标注出各组两两比较的结果。如果下标字母相同,则表示类别列比例间无差异;如果字母不同,则表示类别列比例间存在显著差异。
由表可知,在第一班次中,冲床1和冲床3生产的有缺陷把手数量不存在显著差异,但二者与冲床2存在显著差异;冲床2生产在这一班次生产的有缺陷把手数量最多(76个,49%)。
在第二班次中,各冲床生产的有缺陷把手数量均不存在显著差异;
在第三班次中,冲床1和冲床2生产的有缺陷把手数量存在显著差异;在这一班次,冲床1生产的有缺陷把手数量相对最多(48个,33.6%);冲床3与其它冲床不存在显著差异。
以上是有关卡方检验及其事后两两比较的简单案例,大家学会了吗?好学的小伙伴可以尝试将班次变量作为需要比较的分组变量置于列方向,看看不同班次间是否存在差异哦。
卡方检验是一种常见的统计假设检验方法,主要用于分类变量的统计推断,最常用于考察无序分类变量和分类变量(包括无序和有序)之间的相关性。
有关卡方检验原理和应用的更多介绍在本篇文章中不会展开,不了解这种统计分析方法的读者可以阅读相关历史文章:
领取专属 10元无门槛券
私享最新 技术干货