详细介绍
我们在做假设检验的时候会犯两种错误:第一,原假设是正确的,而你判断它为错误的;第二,原假设是错误的,而你判断它为正确的。我们分别称这两种错误为第一类错误(Type I error)和第二类错误(Type II error)1。
第一类错误:原假设是正确的,却拒绝了原假设。
第二类错误:原假设是错误的,却没有拒绝原假设。
我们常把假设检验比作法庭判案,我们想知道被告是好人还是坏人。原假设是“被告是好人”,备择假设是“被告是坏人”。法庭判案会犯两种错误:如果被告真是好人,而你判他有罪,这是第一类错误(错杀好人);如果被告真是坏人,而你判他无罪,这是第二类错误(放走坏人)。
记忆方法:我们可以把第一类错误记为“以真为假”,把第二类错误记为“以假为真”。当然我们也可以将第一类错误记为“错杀好人”,把第二类错误记为“放走坏人”。1
在其他条件不变的情况下,如果要求犯第一类错误概率越小,那么犯第二类错误的概率就会越大。这个结论比较容易理解,当我们要求“错杀好人”的概率降低时,那么往往就会“放走坏人”。
同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时,那么往往就会“错杀好人”。
概率计算
假设检验是利用反证法,依据样本统计量做出的统计推断,其推断结论有可能发生I型错误(第一类错误)和Ⅱ型错误(第二类错误)两种错误,如表所示2。
I型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平(significance level)。α可取单侧也可取双侧,可以根据需要确定α的大小,一般规定α=0.05或α=0.01。其意义为:如果假设检验结论拒绝H0,发生I型错误的概率为5%或1%,即100次拒绝H0的结论中,平均有5次或1次是错误的。
Ⅱ型错误是指不拒绝实际上不成立的H0,为“存伪”的错误,其概率通常用β表示。β只能取单尾,假设检验时一般不知道β的值,在一定条件下(如已知两总体的差值δ、样本含量n和检验水准α)可以测算出来。在假设检验中同时减少两类错误的最好方法是适当增加样本含量2。
检验的势(power of the test)定义为在原假设是错误的情况下正确拒绝原假设的概率。检验的势等于1减去犯第二类错误的概率:power=1一P(Type II error)
我们用表来更清楚地表示显著性水平和检验的势1。