一、卡方检验的基本假设
卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所做的假设检验。它与平均数的比较、方差分析之间的区别在于,这种方法可以检验离散数据;另外,其所检验的数据可以是非正态分布的,而且凡是可以计算比率的数据都是可以应用卡方检验方法的。
在列联表的分析中,卡方的值等于实际频率和理论频数差的平方与理论频数之比。因此,对于案例中的数据,需要比较实际频数和理论频数。从表1中可以看出实际频数比值的计算:
表1 列联表中实际频数比值计算
检验统计量X2值反映了实际频数与理论频数的吻合程度。如果检验假设H:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即出现大的X2值的概率是很小的。相反,如果数据结果恰好与之相反,我们就怀疑H成立,因而拒绝它,接受其对立假设H1,即π1≠π2。
二、卡方检验解释因果关系的缺点
卡方检验在初级统计中的应用是比较普遍的,但是对于因果关系的解释,使用卡方检验的传统列联表分析是存在缺点的。卡方检验应用存在的问题主要体现为:
(1)缺乏对多变量之间交互作用的分析。在诸如案例这样的列联表,恰恰是列联之间的交互可以反映变量之间的关系,因此,不能充分分析多变量列联之间的交互效应,就不能有效分析多变量之间的关系。(2)对关联效应的分析缺乏必要的统计控制。不能有效解决多变量之间的交互作用,就不能有效地对变量之间的相互影响予以控制,也就无法得到某一变量的“净效应”,即不能确定变量的主效应。(3)不能准确定量描述一个变量对另一个变量的作用幅度。正是因为如此,就不能解释变量之间是否存在因果关系及影响大小。
预留作业
1.复习多元回归分析的基本内容。
2.预习对数线性模型的数学表达。
长按下图可关注
领取专属 10元无门槛券
私享最新 技术干货