在六西格玛项目中或者其他学术研究领域之中,我们经常要对原因和输出结果之间的关系进行分析和确认,这个时候我们就需要用到假设检验。在大部分的研究中,我们想要证明:母体中有某种特定的效应。
例如我们猜想大部分喝咖啡的人都偏好现煮咖啡,为方便讨论,统计检定会先假设我们在找的效应并不存在。然后,我们开始寻找的证据,必须不利这个假设,因而支持我们想找的效应。
假设检验的第一步,是要先列出一个断言,然后我们再试着找出证据来否定它。
原始假设H。
在假设检验中,受检验的断言叫做原始假设(null hypothesis)。检定是设计来评估:否定原始假设的证据有多强。
通常,原始假设都是“没有效应”或“没有差别”的叙述。
“原始假设”这个词用Ho代表,读法是“H零”。Ho是关于母体的叙述,所以一定要用母体参数来表示。咖啡的例子当中的参数,是所有喝咖啡的人里偏爱现煮咖啡的比例 p。原始假设是:
Ho: p=0.5
我们希望或猜想可取代H。的正确叙述,叫对立假设(alternative hypothesis),用Ha表示。在例子中,对立假设就是:喝咖啡的人大多偏好现煮咖啡。用母体参数表示就是:
Ha: p>0.5
假设检验会找对原始假设不利、但对对立假设有利的证据。
如果观察到的结果,在原始假设为真的情况下是出人意料的,而在对立假设为真时却较易发生,这个证据就很强。
比如说,当事实上母体只有一半喜欢现煮咖啡,却发现50位受试者中有36位喜欢,就会出人意料。
有多出人意料呢?用机率来回答这个问题:这个机率指的就是,在Ho正确时实际观察到的结果跟预期结果差距很大的机率,而这个差距至少要等于(或大于)实际观察与预期结果的差距。
怎么样算是“跟预期结果的差距很大”?这既和Ho有关,也和Ha有关。
在试喝测试中,我们希望得到的机率,就是在50人中至少有36人喜欢现煮咖啡的机率。如果原始假设p=0.5正确的话,上述的这个机率会非常小(0.001)。这就是原始假设不正确的有力证据。
假设检验中的 P值(P-value)是在Ho为真的假设下,所得到样本结果会像实际观察结果那么极端或更极端的机率。P值愈小,资料所提供否定Ho的证据就愈强。
在实际应用时,大部分的统计检定可以由会计算P值的电脑软体来执行,例如minitab、SPSS、Excel。
在许多领域中都常见到引用P值来描述研究结果。所以,即使你自己不做假设检验,也应该要知道P值的意义,就像虽然你自己不用计算置信区间,但也应该要了解“95%置信水平”是什么意思。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。