版权归原作者所有,如有侵权,请联系我们

[科普中国]-潜在特质理论

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

潜在特质理论,又称项目反应理论,项目反应理论 ( IRT)是 20世纪 80年代测量专家们研究的主题之一。它建立在潜在心理特质理论基础之上, 不再以整个测验而是以单个测验项目为考察对象, 以要研究的被试的潜在心理特质和被试在测验项目上的反应之间的关系作为自己的核心内容, 并用某种数学形式来表示这种关系。1

概述产生该理论的产生是基于经典测量理论的局限和不足,其不足表现在以下几方面:按经典测量理论所求出的难度、区分度、信度和效度等质量指标,严重依赖于样本,样本的代表性好坏直接影响着这些参数。经典测量理论中测验信度的估计是真分数方差与测验总方差之比,但这是建立在两个前提假设的基础之上,即个体的测验总分仅线性分解为真分数和误差分数两部分,并且这两个部分是相互独立的。经典测量理论认为人的测验总分是这个人在些特质上的真分数和测量误差之和。经典测验理论多是使用匹配和随机化来进行误差控制2 。

含义项目反应理论也称项目特征曲线理论或潜在特质理论,它是依据一定的数学模型,用项目特征参数估计潜在特质的一种测量理论。该理论中最重要的两个基本概念是“潜在特质”和“项目特征曲线”。

发展虽然早期的项目反应模型主要是单维度模型而且更强调双岐项目模式(如拉希模型和三参数逻辑斯蒂模型),而如今一些多维度项目反应模型也逐步发展起来,向其他项目模式的拓展使得它能应用于更多的领域。今天,项目反应理论模型已发展出了等级量表模型、分部评分模型和多重选项计分模型等等。

项目反应理论基础模型例举逻辑斯蒂模型有单参数、双参数及三参数之分,其函数表达式分别如公式1/2/3:

式中,Piippp 表示能力为 θ 的被试在项目上正确作答的概率;θ 表示被试的能力;bii bibibibbbbbibibbbbbbibibibibibibPiippp 表示项目 i 的难度参数;e表示自然对数之底=2.71828;D 表示量表因D=1.7;ai表示项目 i 的区分度参数;cii bibi表示项目 i 的伪随机水平参数,习惯称猜测参数。上述三个模型中以三参数逻辑斯蒂模型应用最为广泛。

项目反应模型的参数估计应用项目反应理论模型对项目的不同参数进行估计是连接项目反应理论与应用的最关键的环节。所谓参数估计是指根据被试的作答反应矩阵, 也就是所有的被试对所有的题目 (或项目 )的作答反应情况, 估计出被试的能力参数和每个项目的参数。参数估计的方法有很多, 我们主要介绍极大似然估计法和贝叶斯估计法。3

(一)极大似然估计法 (maximum likelihood estimation)

极大似然估计法是根据被试的作答反应矩阵, 在局部独立性的条件下, 导出参数估计的似然函数, 然后通过求取似然函数的极大值, 估计项目参数和被试能力参数。因为一个随机变量可能会有各种分布, 或者说可能会以各种概率出现, 在这些概率中, 可能会有一个最可能的最大的概率。因此, / 极大似然估计0就是估计出概率的最可能的极大值。当参数变化时, 概率的非极大值可能不止一个, 但极大值一般只有一个。参数估计时需要估计出两方面的参数:项目参数和能力参数。首先假设项目参数已知, 只对能力参数进行估计, 然后将估计出来的能力值假设为真实值, 只对项目参数进行估计, 将这一过程反复循环进行, 直至参数估计值达到稳定为止。

极大似然估计具有许多优点, 具有一致性、渐进正态性和有效性等基本性质, 成为一种应用最为广泛的参数估计方法, 但它也有两条明显的缺点: ( 1)没有利用关于被试能力的先验知识; ( 2)对于满分和零分的被试无法进行参数估计。极大似然估计法又可细分为联合极大似然估计法( JMLE ) 、条件极大似然估计法 ( CMLE ) 和边际极大似然估计法 (MMLE)。

1. 联合极大似然估计法 ( JMLE )

在测量实践中, 一般的情况是既不知道被试的能力 H,也不知道项目参数, 因此只能同时对这两个参数进行联合极大似然估计。该方法是 Birnbaum首先采用的3,其基本公式如公式4:其中 uij是考生 i 对反应模式为 ( 1, 2, 3, 4, 5)的第 j 题的反应。Pij表示能力为 Hi的被试答对第 j题的概率, Qij= 1- Pij表示能力为 Hi的被试答错第 j 题的概率。

2. 条件极大似然估计法 ( CMLE )

这也是一种同时估计被试潜在特质水平参数与项目参数的方法。运用该方法的前提是得到能力参数的充分统计量。因为 Rasch模型的实得分数是被试能力参数的充分统计量, 所以, 对于 Rasch模型可以采用条件极大似然法进行参数估计。但是对于二值计分的双参数模型和三参数模型以及多值计分模型都不能运用这一种方法, 以前, 该算法还只在少于 30或 40个项目的测验中使用, 当项目数量超过 60个时, 参数估计过程将非常缓慢, 当项目数量超过 80个时, 条件极大似然估计方法失效4。然而, 后来 Gusta2fasson5已将这种方法加以发展并可运用到 80到 100个项目之多的测验之中。

3. 边际极大似然估计法 (MMLE )

对 Rasch模型来说, 条件极大似然估计的效果基本上和边际极大似然估计相近。但边际极大似然估计的一个最大缺点是运算量太大, 需要进行大量的积分运算, 因而只要项目数稍大一点, 这个方法就无法使用6。

( 二 )贝叶斯估计法 ( Bayesian estimation)

为了克服极大似然估计的两个缺点, 贝叶斯估计方法应运而生。贝叶斯估计方法是指利用贝叶斯原理, 确定项目参数和被试能力参数的先验分布, 建立联合极大似然函数, 然后通过求取联合极大似然函数的极大值, 估计出项目参数和被试能力参数。贝叶斯估计的关键是指定各参数的先验概率分布, 这一点对于能力参数似乎还有可能的, 因为如果对一个测验使用的时间长了, 那么对被试相应能力的先验概率分布还有可能做出较为客观的估计, 但是对项目参数先验概率分布的估计则纯粹是主观的。各参数的先验概率分布确定之后, 贝叶斯估计和极大似然估计的方法大致是差不多的。贝叶斯估计方法运用于二值计分模型, 似乎还有可能, 但是对于等级计分模型, 由于每题有多个难度值, 而且这多个难度值有可能是逐渐增大, 也有可能是没有变化规律的, 因此项目参数的先验分布难以确定。贝叶斯估计方法运用到 IRT模型参数当中, 仍有许多理论上和技术上的问题未解决, 而且关于估计方法的稳定性还缺乏证据7。

本词条内容贡献者为:

殷晓莉 - 儿童心理专家 副教授 - 中国科学院心理研究所