随机变量Xij与总平均数的偏差的平方和是刻画试验所得全部数据的离散程度的一个指标,因此,各个总体Xi(i=1,2,...,r)是否同分布,可以从偏差平方和中获得信息,而偏差平方和中包含各总体之间所抽取数据的差异和随机因素造成的试验误差两部分信息,如果能把偏差平方和中的这两部分信息分解出来并对其进行比较,就可以达到检验假设的目的1。
基本介绍在单因素实验中,为了使造成各随机变量之间的差异的大小能定量表示出来,引人:
记在水平下样本和为,其样本均值为因素A下的所有水平的样本总均值为
为了通过分析对比产生样本
之间差异性的原因,从而确定因素A的影响是否显著,我们引人偏差平方和来度量各个体间的差异程度
因能反映全部试验数据之间的差异,所以又称为总偏差平方和2。
偏差平方和的分解如果成立,则r个总体间无显著差异,也就是说因素A对指标没有显著影响,所有的可以认为来自同一个总体,各个间的差异只是由随机因素引起的,若不成立,则在总偏差中,除随机因素引起的差异外,还包括由因素A的不同水平的作用而产生的差异,如果不同水平作用产生的差异比随机因素引起的差异大得多,就认为因素A对指标有显著影响,否则,认为无显著影响。为此,可将总偏差中的这两种差异分开,然后进行比较。
记
则有下面的定理:
定理1(平方和分解定理) 令,有
表示在水平下样本值与样本均值之间的差异,它是由随机误差引起的,称为误差平方和或组内平方和。反映在每个水平下的样本均值与样本总均值的差异,它是由因素A取不同水平引起的,称为因素A的效应平方和或组间平方和,式就是我们所需要的平方和分解式2。
SE与SA的统计特性如果成立,则所有的都服从正态分布,且相互独立,则有:
定理2
(1) ,且,所以为的无偏估计;
(2) ,且,因此为的无偏估计;
(3) 与相互独立;
(4)。
本词条内容贡献者为:
王海侠 - 副教授 - 南京理工大学