导 读
上期我们提到,当四格表资料的样本量n<40或四个格子中至少存在一个格子的频数T<1时,需要用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table data)法。
四格表资料的卡方检验的内容详见:
《如何用四格表卡方检验进行医学数据的统计分析?》
下面,我们一起来了解两样本的四格表资料的Fisher 确切概率法的基本原理、适用条件及其在SPSS中的操作步骤。
下方为视频版,含软件操作步骤和详细的结果解读。
一、基本形式
四格表资料的Fisher确切概率法的表格基本形式与常规四格表一致。
其基本思想是在四格表周边合计数T1、T2、T3、T4不变的条件下,计算表内a、b、c、d,4个频数变动时的各种组合的概率Pi;再按检验假设用单侧或双侧的累计概率P,依据所取的检验水准α进行判断。
(1)计算各组合的概率Pi
各组合的概率Pi服从超几何分布,其和为1。
“!”为阶乘符号。
(2)计算累计概率P
单侧和双侧检验计算累计概率P的方法不同,我们假定Pi(i=1,2……)对应于a从小到大的概率,并记给定的样本四格表的概率为P*。
为单侧检验时:P=PL或PR,其中,PL和PR分别表示给定四格表及其以左或以右的所有四格表的累计概率。
为双侧检验时:
即计算所有满足Pi小于等于P*的四格表的组合的概率之和。
(3)根据α的水准进行判断
若α=0.05,则比较累计概率P与0.05的大小来进行判断;
若α=0.01,则比较累计概率P与0.01的大小来进行判断。
二、基本假设
根据专业知识来判断检验的方向,Fisher确切概率法的假设可以有多种形式。具体如下:
三、需满足的条件
四格表资料的样本量n<40或四个格子中至少存在一个格子的频数T<1。
四、案例解读
某机构为研究某药物A对成人感冒的治疗效果,将31例有相同感冒症状的患者随机分成用药组(16人)和非用药组(15),得到药物A的治疗结果数据如下:
由上图可知本样例样本量n=31<40,所以采用Fisher确切概率法进行计算。
(1)在SPSS中的具体操作
打开SPSS,将以上四格表的数据输入到软件中。包括有组别和有效性条件列以及频数列,其中,组别(1=用药组;2=非用药组),治疗效果(0=仍然感冒;1=恢复)。
关于数据加权还原的操作由于前期已经详细讲解过,因此不再赘述,具体请看:
《如何用四格表卡方检验进行医学数据的统计分析?》
依次点击“分析——描述统计——交叉表格”。
在“交叉表格”窗口中,将“组别”属性选入行中,“有效性”属性选入列中,并点击“精确”
在出现的“精确检验”窗口中,勾选“精确”和“每个检验的时间限制为5分钟”,点击“继续”。
在“交叉表格”窗口中,点击“statistics”,在出现的“统计”窗口中,勾选“卡方”。
点击“继续”,然后“确定”,得到结果。
(2)结果解读
根据得到的三个表,主要查看“卡方检验”表,读取“Fisher精确检验”对应的显著性值P=0.066>0.05,即接受原假设,认为原假设用药组与非用药组的有效率相等,即药物A治疗感冒的效果并不显著。
五、小结
本文对四格表资料的Fisher确切概率法的基本原理、应用及其在SPSS中的具体操作进行了详细阐述。后续我们将陆续更新更多不同卡方检验方法在医学研究中的应用和在统计软件中的实现,敬请关注!
参考文献:
1、孙振球,徐勇勇.《医学统计学 第4版》.人民卫生出版社.
2、邱皓政.《量化研究与统计分析》.重庆大学出版社.
领取专属 10元无门槛券
私享最新 技术干货