定义
根据最小二乘法原理,平方和称为剩余平****方和或残差平方和,它表明除x对y的线性变化之外的一切因素(包括x对y的非线性影响及测量误差等)对y的离差的影响。1
相关介绍
回归分析表明,因变量y的实际值(观察值)有大有小、上下波动,对每一个观察值来说,波动的大小可用离差()来表示。离差产生的原因有两个方面:一是受自变量变动的影响;二是受其他因素的影响(包括观察或实验中产生的误差的影响)。n个观察值总的波动大小用总离差平方和表示。
由图1可以看出,每个观察点的离差可以分解为两部分,即
其中,为剩余离差;(为回归离差。
将上式两边平方,然后对所有的n求和,则有
式中,交错的乘积项等于零,因而总离差平方和为
即:
总离差平方和=剩余平方和+回归平方和
剩余平方和又称残差平方和,它反映了自变量对因变量的线性影响之外的一切因素(包括对的非线性影响和测量误差等)对因变量的作用。回归平方和表示在总离差平方和中,由于与的线性关系而引起因变量变化的部分。
上式可写成
其中
每个平方和都有一个自由度同它相联系。正如总离差平方和可以分解成剩余平方和Q与回归平方和U两部分一样,总离差平方和的自由度也等于剩余平方和的自由度与回归平方和的自由度之和,即
其中
在总离差平方和中,Q越大就意味着U越小,U越小表示变量间线性相关性越低,当且仅当b=0时,U是最小的。可见,要检验总体两变量间是否真正线性相关,可以检验总体回归系数b是否等于零。
①提出零假设和备择假设:
②当x与y有线性关系时,可以用F统计量检验零假设。
其中,表示第一自由度为1,第二自由度为的F分布。F检验是检验回归方程是否真正线性相关的一种方法,它是建立在对总离差平方和分解的基础上进行的。
这时,若给定显著性水平,计算F值与查表得到的F值比较(一般取0.05,0.01等,1-表示检验的可靠度)。如果,则称变量x与y没有明显的线性关系,接受,说明回归方程不显著;如果,则拒绝,说明x与y有显著的线性关系。2