目前,有部分朋友认为,做偏倚和线性的分析,其方法应该按照手册第三章第B节的指导进行,为了方便读者,我把关键的判据内容摘录如下(原版原文):
准确地意译成中文就是:
“9)在显著性水平α下,如果满足以下两条中的一条就认为偏倚在统计上为零:
关于统计量tbias的检验P值<α;
或者
按下式,零落在1-α的置信区间内(公式略,参见上面图片)。”
请注意这里的关键字眼“or(或者)”,本文后面还会重点提到这个词。
基于此,有朋友认为应采用如下报告形式:
相信这样一份线性偏倚报告伴随了一些小伙伴很久了吧?而且很多小伙伴也很认真地执行手册的判据要求,认为统计上,偏倚Bias=0成立,才能接受;否则,当Bias≠0时,这套测量系统就不能被接受。具体的方法就是看Bias=0的线是否落在95%的置信区间内。
当然,还有用回归分析法的线性报告:
那么,类似于上述这两种报告本身的逻辑是什么?
理论上,上述线性、偏倚分析报告的逻辑本身并没有问题。我们先看第一份偏倚和线性的报告。这份报告的逻辑是基于假设t检验法而进行的判断(当然了,这是在总体方差σ2未知的情况下,如果总体方差σ2是已知的,我们就要用Z检验法。区别是,t检验法用到了样本方差S2对总体方差σ2进行无偏估计而得到的近似于Z检验统计量的一种检验统计量),判断的结果是测量系统“是否存在显著的偏倚和线性误差”。请注意,仅止于此哦,它没有进一步的判断!具体进一步判断后面会讲,而且一定要讲到,这很重要。
我们再看第二份报告,第二份报告的逻辑是基于一元线性回归做的一份线性分析报告,当然报告中是根据偏倚进行计算的,但报告的目的仅仅是用于线性拟合优度的判定。
在统计学上,我们通常把统计方法归类如下:
那么,回到MSA手册第三章第B节的判据上来:
“9)在显著性水平α下,如果满足以下两条中的一条就认为偏倚在统计上为零:
关于统计量tbias的检验P值<α;——这个就是P值法
或者
按下式,零落在1-α的置信区间内。——这个就是临界值法”
前文让小伙伴们注意“or(或者)”,这里要重点提一下这个“or(或者)”。无论是英文的“or”还是中文的“或者”,相信意思不用我解释了吧。我想说的,手册的给的两个判据,其作用是一样的,只是方法不同,一个是“P值法”,一个“临界值法”,我们用其中任何一种方法都是可以的。那么,为什么偏偏就有很多朋友会选择第二条呢?
经过个人反复对现存资料的对照研究发现,其原因很是匪夷所思——翻译工作的失误。
经过对照各种第四版MSA手册的中文翻译版本,总结了两点翻译上的失误:
(A)把第一条给漏了
(B)在没漏的情况下,把“or(或者)”翻译成“如果符合以下两种情况”。
而这恰恰是偏倚方法优选的根本理论依据,这种优选是放弃“临界值法”从而选择更加便捷而且优于“临界值法”的“P值法”。为什么P值法是优选的呢?
我们知道,假设检验包括临界值法和P值法两种,用临界值法确定原假设H的拒绝域时,例如当α=0.05时我们知道要拒绝H,再取α=0.01时我们一样也能知道要拒绝H,但我们不能知道将α再降低一些(注意,是一些,具体多少不清楚)是否还要拒绝H,而P值法给出的是拒绝H的最小显著性水平α,因此,P值法比临界值法给出了更多有关拒绝域的信息,更能涵盖“拒绝”与“接受”的范围,所以P值法在某种程度上是优于临界值法的,尤其是在只做判断的而不是寻找拒绝域的情况下。
然而,偏倚分析工作做到这里只完成了一半,另一半工作还需要进一步完成。另一半工作是什么工作呢?
想要知道答案,我们必须先明白一个道理:那就是手册给出的假设t检验仅仅止于“是否存在显著偏倚”(线性同理)的判断,而存在的程度是多少呢?手册并没有明确说明。
那我们要不要知道这个“程度”呢,我们举个计量学方面的例子来说明吧。
举卡尺比较浅显易懂,我们就说卡尺吧。
我们使用者当然希望卡尺的误差是没有的吧?根据这样的使用目的,我们要对某卡尺的误差进行探讨,当然应进行如下假设:
原假设H:卡尺误差Δ=0
备择项H1:卡尺误差Δ≠0
假如通过取样进行t检验我们得出结论:拒绝原假设H
搞过计量的小伙伴们应该都清楚卡尺在绝大多数情况下都是这种情况吧,换句话说,这把卡尺在统计上存在显著的误差。
问题来了,这把卡尺的误差能被接受吗?
答案当然是:我们需要进一步看看卡尺误差的程度再做决定!
而误差的程度在计量学上不就是“准确度”吗?和谁比?参考谁?有人说参考量块,其实那只是确认卡尺误差的一个必要条件而已,卡尺误差真正参考的是一个误差限!和误差限比,卡尺的误差程度是多少,这才是我们关心的,至于你用量块还是用别的什么标准件确定的误差我不管,只要你符合量传规则就行。
比如,我给出某测量点的误差限是±0.03mm,经过校准发现,卡尺的误差Δ=+0.02mm,那么,这把卡尺的误差是可以被接受的。
再强调一遍,t检验确认的是“是否存在显著的误差”的问题,而给出参考比值确认的是“误差的程度有多大”,这是一个递进的逻辑关系。
测量仪器的误差可以这样理解,测量系统的偏倚为什么就理解不了呢?
只不过要把测量仪器的“误差限”换成“过程变差”或“公差范围”,然后乘上100%,不就可以得到测量系统的偏倚程度了吗?
而这种“程度”思想在Minitab公司的统计软件中早就被广泛地应用,应用的历史要追溯到上个世纪70年代,只是测量系统的应用在2000之后,但思想是一样的。
而且,Minitab软件得出的偏倚和线性分析结果包含了上述所提到的各个重点,包括P值法、临界值法、偏倚的程度(百分率)、线性的程度(百分率),甚至还包括一元线性回归分析的拟合优度R-sq等等。为了方便读者朋友,我在下图中一一标注了出来(当然,具体如何去解读这个结果,由于篇幅和主题问题,我就不在这里展开了。):
备注:
①临界值法
②P值法
③偏倚和线性程度
④回归分析的拟合优度
试问,这么先进的分析手段不用,我们还要用十几年前的那张Excel表吗?而且那张Excel表有多少小伙伴能从统计学上去解释它的结果呢?它是使用效率有考虑过吗?我们解释不清楚,客户一旦问起来怎么办?忽悠吗?
本文的编写目的就是普及先进的偏倚和线性分析方法和手段,不足的方法我们要——断——舍——离——,好的方法要果断引进到实际工作中去,起到真正服务于质量管理的作用。
线性是一个道理,我就不赘述了。
领取专属 10元无门槛券
私享最新 技术干货