版权归原作者所有,如有侵权,请联系我们

[科普中国]-充分统计量

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

基本介绍

样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。如何将这一想法用数学形式表示呢?费希尔在1922年提出了一个重要概念——充分统计量计量。粗略地说,充分统计量就是不损失信息的统充分统计量在简化统计问题中是非常重要的概念,也是经典统计和贝叶斯统计中为数不多的相一致的观点之一。2

经典统计中的定义与判断定义在经典统计中充分统计量是这样定义的:

是来自分布函数 的样本 是一个统计量,如果在给定 的条件下,x的分布与 无关,则称统计量 的充分统计量。

在一般情况下,用上述定义直接验证一个统计量是困难的,因为需要计算条件分布,幸好有一个判断充分统计量的充要条件——因子分解定理。3

定理一个统计量 是参数 的充分统计量,其充分必要条件是存在一个t与 的函数和一个样本的函数 ,使得对于任何一个样本x和任意的 ,样本的联合密度函数 可以表示为它们的乘积,即3

由于样本的联合密度函数 ,就是似然估计函数 ,所以也可以把上述定理的相应部分改成

贝叶斯统计中充分统计量的判断
在贝叶斯统计中判断一个统计量是充分统计量也有一个充要条件。3

定理设 是来自密度函数 的样本, 是一个统计量,它的密度函数为 ,又设 是参数 的某个先验分布族,则统计量 是参数 的充分统计量的充分必要条件是,对任意一个先验分布 ,有

即用样本分布 算得的后验分布与用充分统计量 算得的后验分布是相同的。

注意点1.定理给出的条件是充分必要的,因此定理的充分必要条件可以作为充分统计量的贝叶斯定义。
2.如果已知统计量 是充分统计量,那么根据定理,其后验分布可用该统计量的分布算得,由于充分统计量可以简化数据、降低维数,因此定理也可以简化后验分布的计算。3

例题解析设 是来自正态分布 的样本,由于 的充分统计量,若 的先验分布取正态分布 ,其中 为已知,那么 的后验分布可用充分统计量 的分布算得,即

因此后验分布是正态分布。3