等级线性模型(简称HLM,Hierarchical Linear Model)也称为mixed-effect model,random-effect models或者multilevel linear models,是一种复杂的统计模型。在计量经济学文献中也常常被称为Random-coefficient regression models(Rosenberg, 1973; Longford, 1993)。在某些统计学文献种也被称为Covariance components models(Dempster, Rubin, & Tsutakawa, 1981; Longford, 1987)。现在广泛被使用的名称Hierarchical Linear Model最早出现于1972年Lindley and Smith的论文以及1973年Smith的论文。
软件许多流行的统计软件包都可以进行HLM的分析。最常用的包括同名软件HLM(Raudenbush et al.,2000),MIXOR (Hedeker & Gibbons, 1996),MLWIN (Rasbash et al., 2000), SASProc Mixed (Little et al., 1996) VARCL (Longford, 1988). 贝叶斯方法在90年代由Gelfand et al.以及Mike Seltzer发展起来,现在可以在BUGS ( Spiegelhalter et al., 1994)下实现。
模型类型在进行多级模型分析之前,研究人员必须决定几个方面,包括哪些预测因子将被纳入分析中(如果有的话)。其次,研究人员必须决定参数值(即,将被估计的元素)是固定的还是随机的。固定参数由所有组的常数组成,而随机参数对每个组具有不同的值。此外,研究人员必须决定是采用最大似然估计还是限制最大似然估计类型。
随机截取模型随机截距模型是允许截距变化的模型,因此,每个单独观察的因变量的得分是通过不同组间的截距来预测的。该模型假设斜率是固定的(在不同的上下文中相同)。此外,该模型提供了有关组内相关性的信息,这有助于确定首先是否需要多级模型。
随机斜率模型随机斜率模型是允许斜率变化的模型,因此,斜率在组之间是不同的。该模型假设截距是固定的(在不同的上下文中相同)。
随机截距和斜率模型包含随机截距和随机斜率的模型可能是最现实的模型类型,尽管它也是最复杂的模型。在这个模型中,允许截距和斜率在不同的组中变化,这意味着它们在不同的上下文中是不同的。
开发多层次模型为了进行多级模型分析,可以从固定系数(斜率和截距)开始。一方面将被允许一次变化(即,将被改变),并与之前的模型进行比较,以评估更好的模型拟合。研究人员在评估模型时会提出三个不同的问题。首先,它是一个好模型吗?第二,更复杂的模型更好吗?第三,个人预测因子对模型有何贡献?
为了评估模型,将检查不同的模型拟合统计量。一个这样的统计数据是卡方似然比检验,它评估模型之间的差异。似然比检验可以用于一般的模型构建,用于检查当模型中的效果被允许变化时发生的情况,以及当将虚拟编码的分类变量作为单一效应进行测试时。但是,测试只能在嵌套模型时使用(意味着更复杂的模型包含更简单模型的所有效果)。在测试非嵌套模型时,可以使用Akaike信息准则(AIC)或贝叶斯信息准则(BIC)等进行模型之间的比较。查看更多模型选择。
假设多级模型具有与其他主要一般线性模型(例如,ANOVA,回归)相同的假设,但是一些假设针对设计的分层性质(即,嵌套数据)而被修改。
线性线性假设表明变量之间存在直线(直线,非线性或U形)关系。但是,该模型可以扩展到非线性关系。
常态正态假设表明模型的每个级别的误差项都是正态分布的。然而,大多数统计软件允许人们为方差项指定不同的分布,例如泊松,二项式,逻辑。多级建模方法可用于所有形式的广义线性模型。
方差齐性同方差性的假设,也称为方差的同质性,假设人口方差相等。然而,可以指定不同的方差 - 相关矩阵来解释这一点,并且方差的异质性本身可以被建模。
观察的独立性独立性是一般线性模型的假设,其表明案例是来自群体的随机样本,并且因变量上的分数彼此独立。多层次模型的主要目的之一是处理违反独立性假设的情况;然而,多级模型确实假设1)1级和2级残差是不相关的,2)最高级别的误差(由残差测量)是不相关的1。
统计测试在多级模型中使用的统计测试类型取决于是否正在检查固定效应或方差分量。在检查固定效应时,将测试与固定效应的标准误差进行比较,从而进行Z检验。还可以计算t检验。在计算t检验时,重要的是要记住自由度,这取决于预测因子的水平(例如,1级预测因子或2级预测因子)。对于1级预测器,自由度基于1级预测器的数量,组的数量和单个观察的数量。对于2级预测变量,自由度基于2级预测变量的数量和组的数量。
统计力量多级模型的统计功效根据是否是正在检查的1级或2级效果而不同。 1级效应的能力取决于个体观察的数量,而2级效应的能力取决于组的数量。为了进行足够功率的研究,多级模型需要大样本量。然而,群体中的个体观察数量并不像研究中的群体数量那么重要。为了检测跨层次的相互作用,鉴于群体规模不是太小,已经建议至少需要20个群体。多级模型中的统计功效问题因功率随效应大小和组内相关性而变化而变得复杂,固定效应与随机效应不同,并且根据组的数量和个体观察的数量而变化每组。
本词条内容贡献者为:
孔祥杰 - 副教授 - 大连理工大学软件学院