概念
判定系数(coefficient of determination,记为或)在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例,以此来判断统计模型的解释力。
对于简单线性回归而言,判定系数为样本相关系数的平方。当加入其他回归自变量后,决定系数相应地变为多重相关系数的平方。
假设一数据集包括 共n个观察值,相对应的模型预测值分别为 。定义残差 ,平均观察值为
于是可以得到总平方和
回归平方和
残差平方和
由此,判定系数可定义为1
说明:图1中判定系数,该统计量越接近于1,模型的拟合优度越高。
系数标准判定系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中单个解释变量的影响程度。
判定系数达到多少为宜?没有一个统一的明确界限值;若建模的目的是预测因变量值,一般需考虑有较高的判定系数。若建模的目的是结构分析,就不能只追求高的判定系数,而是要得到总体回归系数的可信任的估计量。判定系数高并不一定说明每个回归系数都可信任。