版权归原作者所有,如有侵权,请联系我们

[科普中国]-回归曲线

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

曲线回归(curve regression) 是建立不同变量间相关关系的非线性数学模型数量关系式的统计方法,也称为非线性回归。农业化学中各种因素间的相互关系多数是曲线关系1。

可化为直线的回归可化为直线的回归是曲线回归中应用最广泛的形式。对某种形式的曲线回归模型取一定形式的变量变换,转换为线性回归模型,即可将曲线回归以线性回归的方法计算出式中各项参数,并进行统计检验和推断。可化为直线的曲线回归种类多样,常用的见表。

|| || 常用曲线回归方程的线性化方法

|| ||

|| ||

正交多项式回归关于多项式回归,可参考相应词条1。

多元线性回归及多项式回归的计算量随待估参数的数目增多而大量增加,而且各因素之间存在相关性。若需剔除不显著因素,则其他因素的回归系数需重新计算。解决这些困难的最常用办法是采用正交多项式,其前提是试验因素的水平间隔h要相等。对等间距水平的试验引进一族正交多项式,经数据变换后符合正交条件,从而消除了各因素之间相关性,并简化计算过程。正交多项式同样适用于多元多项式回归。

生长曲线作物及养分吸收在生长初期较慢,达一定时间后积累迅速,以后又逐渐减缓,这种曲线大多呈S形,统称为生长曲线。这种理论曲线的模型呈正态曲线或近似于正态曲线。施肥对生长曲线的模型参数有明显影响,故在农业化学研究中亦常用生长曲线。生长曲线可分为从正态曲线假定出发及不以正态曲线出发两类。以正态假设出发的典型曲线是对称的S形曲线,其理论依据是将试验数据y转化为正态累积函数的标准差单位μ,当处理的水平变量为X时,则1:

式(1)中μx、σx分别为变量X的总体平均值与标准差。对特定总体μx、σx为常数。故:

y值转换为正态离差后,X与μ呈线性关系。由于正态累积函数的标准差单位有正值和负值,为便于计算,定义ρ=μ+5以消去负值,P称为概率单位。p与μ只相差常量5,不改变曲线形态,于是式(2)转化为式(3)

式(3)中

有时生长曲线呈不对称分布的S形,常对处理变量X取对数变换,则式(2)、式(3)成式(4)、式(5)形式,而成为正态曲线:

不以正态曲线出发的S形曲线有更广泛的适用范围,最著名的是洛杰蒂克(Logistic)生长曲线:

农化试验取得试验数据往往可用不同数学模型拟合,从中选定最适的模型可以缩小模型误差,这就需要从各种曲线回归模式中选择误差最小的一种,同时要注意尽可能在专业知识方面得到合理的解释1。