方差分析模型(variance analysis model)是一种特殊的线性模型,其设计矩阵X的元素全为0或1,模型参数为因素水平的效应值,且满足一定的线性约束条件。一般情况下,基本的方差分析模型包含以下三类:一元方差分析**、**协方差分析、多元方差分析。
简介在实际应用中,常常需要判断几组观察到的数据或者处理的结果是否存在显著差异。比如,想要了解不同地区的信用卡用户在月均消费水平上是否存在差异就是多组数据是否存在差异的示例,至于不同处理的结果是否存在差异的示例也有很多,例如,几种用于缓解手术后疼痛的药品,它们之间的治疗效果即药效持续的平均时间是否存在差异,实际上考察的就是不同的处理(将药品作用于患者)其结果是否存在差异。若上述的信用卡月均消费水平或治疗效果存在差异,那么这种差异是统计显著的吗?也就是说,这种差异是某一个或几个因素作用的结果吗?
而方差分析模型就是用于检验两组或者两组以上样本的均值是否具备显著性差异的一种有效的数理统计方法。方差分析模型用于鉴别某个(些)因素对结果有无显著影响,以及影响大小的方法。影响试验结果的因素大致分为两类:一类是可以认为加以控制或测定,成为可控制因素;另一类是人为无法定量控制或直接观测的,成为随机因素。方差分析鉴定的主要是可控制因素对结果的影响。
概念下面介绍下方差分析模型中涉及的一些基本概念:
(1)因变量(Dependent):实验结果;
(2)因素(Factor):影响实验结果的自变量,也称为因子;
(3)水平:为了研究自变量对因变量的影响,需要考虑自变量两个或多个不同的取值情况,这些取值称为因子的水平
(4)控制因素:因素的不同水平一定会导致不同的实验结果;
(5)随机因素(不可控因素):因素的水平与实验结果的关系是随机的,即不确定因素。
方差分析模型应用时对样本的要求如下:
(1)独立性:各样本必须是相互独立的随机样本,样本含量尽可能相等或相差不大;
(2)可比性 :样本均值不相同,可比较;
(3)正态性:样本的总体服从正态分布或近似正态分布,偏态分布不适用于方差分析,对偏态分布应考虑用对数转换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态分布后再进行方差分析。
(4)方差齐性;各组之间的方差具有齐性;
分类一般情况下,基本的方差分析模型包含以下三类:一元方差分析,协方差分析,多元方差分析。这三类可根据具体情况再进行细分单因素方法分析与多因素方差分析。
单因素方差分析单因素方差分析常应用于完全随机设计的多组资料的均数比较中。
多因素方差分析方差分析的基础是把变异分为组件误差和随机误差两部分。多因素的方差分析也是不同因素组间影响的误差之和和随机误差之和。
应用方差分析模型主要用途1:
①均数差别的显著性检验;
②分离各有关因素并估计其对总变异的作用;
③分析因素间的交互作用;
④方差齐性检验。
本词条内容贡献者为:
刘军 - 副研究员 - 中国科学院工程热物理研究所