版权归原作者所有,如有侵权,请联系我们

[科普中国]-先验分布

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

先验分布(prior distribution)一译“验前分布”“事前分布”。是概率分布的一种。与“后验分布”相对。与试验结果无关,或与随机抽样无关,反映在进行统计试验之前根据其他有关参数口的知识而得到的分布。1

贝叶斯学派认为,在进行观察以获得样本之前,人们对θ也会有一些知识。因为是在试验观察之前,故称之为先验知识。因此,贝叶斯派认为,应该把θ看作是随机变量。θ的分布函数记为H(θ),θ的密度函数记为h(θ),分别称为先验分布函数和先验密度函数,两者合称为先验分布。

定义参数空间上的任一概率分布 π 称为参数 θ 的一个先验分布。先验分步反映了人们对参数的经验认识。例如设总体X~F(x;θ),θ∈Θ,其中F(x;θ)形式已知,参数θ未知,求θ的点估计问题。2

描述先验分布是总体分布参数θ的一个概率分布。

贝叶斯学派的根本观点,是认为在关于θ的任何统计推断问题中,除了使用样本X所提供的信息外,还必须对θ规定一个先验分布,它是在进行推断时不可或缺的一个要素。贝叶斯学派把先验分布解释为在抽样前就有的关于θ的先验信息的概率表述,先验分布不必有客观的依据,它可以部分地或完全地基于主观信念。

例如,某甲怀疑自己患有一种疾病A,在就诊时医生对他测了诸如体温、血压等指标,其结果构成样本X。引进参数θ:有病时,θ=1;无病时,θ=0。X的分布取决于θ是0还是1,因而知道了X有助于推断θ是否为1。

按传统(频率)学派的观点,医生诊断时,只使用X提供的信息;而按贝叶斯学派观点,则认为只有在规定了一个介于0与1之间的数p作为事件{θ=1}的先验概率时,才能对甲是否有病(即θ是否为1)进行推断。p这个数刻画了本问题的先验分布,且可解释为疾病A的发病率。

先验分布的规定对推断结果有影响,如在此例中,若疾病A的发病率很小,医生将倾向于只有在样本X显示出很强的证据时,才诊断甲有病。在这里先验分布的使用看来是合理的,但贝叶斯学派并不是基于“p是发病率”这样一个解释而使用它的,事实上即使对本病的发病率毫无所知,也必须规定这样一个p,否则问题就无法求解。

后验分布当参数 θ 的先验分布已知时,称在给定样本 x 下 θ 定条件分布为参数 θ 的后验分布(posterior distribution)。

假定样本 x 的密度函数为,则θ 的后验分布为

其中

后验分布可看成是在获得样本 x 后对参数先验知识的调整。

本词条内容贡献者为:

王海侠 - 副教授 - 南京理工大学