假设检定是推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。1
定义假设检定是推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。1
统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为零假设(null hypothesis),零假设通常由研究者决定,反应研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择假设(alternative hypothesis),它通常反应了执行检定的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想知道的)。
假设检验的种类包括:t检验,Z检验,卡方检验,F检验等等。
说明假设检定的过程,可以用法庭的审理来说明。先想像现在法庭上有一名被告,假设该被告是清白的,而检察官必须要提出足够的证据去证明被告的确有罪。 在证明被告有罪前,被告是被假设为清白的。
假设被告清白的假设,就相当于零假设(null hypothesis)。
假设被告有罪的假设,则是备择假设(alternative hypothesis)。
而检察官提出的证据,是否足以确定该被告有罪,则要经过检验。 这样子的检验过程就相当于用T检验或Z检验去检视研究者所搜集到的统计资料。
检验过程在统计学的文献中,假设检验发挥了重要作用。假设检验大致有如下步骤:
最初研究假设为真相不明。
第一步是提出相关的零假设和备择假设。这是很重要的,因为错误陈述假设会导致后面的过程变得混乱。
第二步是考虑检验中对样本做出的统计假设;例如,关于独立性的假设或关于观测数据的分布的形式的假设。这个步骤也同样重要,因为无效的假设将意味着试验的结果是无效的。
决定哪个检测是合适的,并确定相关检验统计量T。
在零假设下推导检验统计量的分布。在标准情况下应该会得出一个熟知的结果。比如检验统计量可能会符合学生t-分布或正态分布。
选择一个显著性水平(α),若低于这个概率阈值,就会拒绝零假设。最常用的是 5% 和 1%。
根据在零假设成立时的检验统计量T分布,找到数值最接近备择假设,且机率为显著性水平 (α)的区域,此区域称为“拒绝域”,意思是在零假设成立的前提下,落在拒绝域的机率只有α。
针对检验统计量T,根据样本计算其估计值tobs。
若估计值tobs未落在“拒绝域”,接受零假设。若估计值tobs落在“拒绝域”,拒绝零假设,接受备择假设。
例子淑女品茶是一个有关假设检验的著名例子,费雪的一个女同事声称可以判断在奶茶中,是先加入茶还是先加入牛奶。费雪提议给她八杯奶茶,四杯先加茶,四杯先加牛奶,但随机排列,而女同事要说出这八杯奶茶中,哪些先加牛奶,哪些先加茶,检验统计量是确认正确的次数。零假设是女同事无法判断奶茶中的茶先加入还是牛奶先加入,备择假设为女同事有此能力。
若单纯以机率考虑(即女同事没有判断的能力)下,八杯都正确的机率为1/70,约1.4%,因此“拒绝域”为八杯的结果都正确。而测试结果为女同事八杯的结果都正确,在统计上是相当显著的的结果。2
相关条目方差分析或变方分析(Analysis of variance,简称ANOVA)为数据分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Independent variable)的关系,当自变项的因子中包含等于或超过三个类别情况下,检定其各类别间平均数是否相等的统计模式,广义上可将T检定中方差相等(Equality of variance)的合并T检定(Pooled T-test)视为是方差分析的一种,基于T检定为分析两组平均数是否相等,并且采用相同的计算概念,而实际上当方差分析套用在合并T检定的分析上时,产生的F值则会等于T检定的平方项。
方差分析依靠F-分布为概率分布的依据,利用平方和(Sum of square)与自由度(Degree of freedom)所计算的组间与组内均方(Mean of square)估计出F值,若有显著差异则考量进行事后比较或称多重比较(Multiple comparison),较常见的为Scheffé's method、Tukey-Kramer method与Bonferroni correction,用于探讨其各组之间的差异为何。
本词条内容贡献者为:
尚华娟 - 副教授 - 上海财经大学