版权归原作者所有,如有侵权,请联系我们

[科普中国]-抽样单元

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

定义

在抽样的过程中,每一个阶段所选取的元素或者元素的集合,称为抽样单元(sampling unit)。单一阶段抽样的抽样单元通常就是元素;多阶段抽样的抽样单元在每一阶段都会有些不同。例如在中国以多阶段集群抽样进行
民意调查,其第一个抽样单元可能是省,第二阶段可能是市,第三阶段是区,等等,最后一个阶段的抽样单元是人,因为“人”才是这整个调查总体——“所有中国人”的元素。2

抽样单元是构成抽样框的基本要素。抽样单元可以只包括一个个体;抽样单元也可以包括若干个个体,并进行分级。

抽样单元可以是构成抽样框的最小单位——基本单元。如要调查某所大学的学生月生活费支出情况,抽样框就是包含该大学所有学生的名单,每一个学生就是一个抽样单元。再进一步推论,在简单随机抽样调查中,抽样单元即基本单元。

抽样单元可以包含若干个个体,如调查大学生生活费支出情况时,我们以班级为抽样单元,则班级的每一个学生就是基本单元。把这种抽样推广之,在整群抽样中,抽样单元是群,群内包含了相当多的基本单元。

无论抽样单元如何划分,抽样单元必须是已知的、有限的,并且最终可以找到作为抽样的基本单元。因为基本单元身上承载了基本的信息数据,它是抽样估计的基础。3

分类抽样单元可大可小,可以分级,可分为一级抽样单元(primary sampling unit)、二级抽样单元(secondary sampling unit)。基本抽样单元(最小一级抽样单元)。例如,在对我国人口情况作抽样调查时,可以将省份作为一级抽样单元,先抽省;再在省内抽样时又可以将县作为二级抽样单元;在县内抽样时又可以将村作为三级抽样单元;以此类推。

抽样单元可以是人为划分的,也可以是自然形成的。实际工作中,特别是社会经济调查中各级行政单位经常可以用来作为各级抽样单元。例如一项全国性调查,可以将省(自治区、直辖市)作为一级抽样单元,将市县作为二级抽样单元,将街道、乡、镇作为三级抽样单元,将居民委员会或村民委员会作为四级抽样单元,而更小的抽样单元又可以是住户甚至是个人。

不论抽样单元如何划分,其必定是已知的,是有限的,并且最终可以找到作为调查客体的基本单元。

为了抽样的方便,常需要一份包含所有单元的名单或清册,这样的名单或清册称为抽样框(sampling frame)。在抽样框中,每个抽样单元都被编上一个号码,由此可以按一定的随机化程序进行抽样。在抽样完成后,抽样者也可以根据抽样框找到具体抽样单元,从而实施调查。抽样框的形式是多样的,除了上面提到的名单或清册,也可以是一张地图或其他适当的形式。一般把抽样框分为三种:名录抽样框、区域抽样框、自然抽样框。不管怎样,抽样框中的抽样单元必须是有序的,便于编号。而且原则上抽样框中的抽样单元既不能重复,也不能有遗漏。4

与抽样框关系抽样框与抽样单元是抽样的一对基本范畴。其单元满足“与实际总体的每个单元之间存在确定的对应关系,凭借这种对应关系可以找到实际总体中特定的一个或一些单元”条件的实际总体的映射总体称为抽样框,构成映射总体的单元则称为抽样单元。

换言之,包含所有抽样单元的总体称为抽样框。

抽样单元构成抽样框的单元称为抽样单元。

事实上,为了方便抽样的实施,必须拥有一个目录性清单,这个目录性清单中的每个目录项与实际总体的每个单元之间存在确定的对应关系,即根据一个目录项总可以找到实际总体中特定的一个或一些单元。抽样框就是这种一个目录性清单。 抽样框可能以各种形式出现:名单、手册、地图、数据包……。由于无论抽样框采取何种形式,在抽样之后,调查者必须能够根据抽样框找到具体的抽样单元。因此,1)抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列。2)抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样误差。 抽样单元不仅指构成抽样框的目录项,同时还表示该目录项所对应的实际总体特定的一个或一些单元。形象地说,不仅是影子,还是影子所反映的实体。尽管目前所见的抽样文献对此不置一词,但读者记住这一点仍大有裨益。为了区分抽样单元的这两种不同意义,实体抽样单元又称为样本单元或样本点。 抽样单元不一定是组成总体的最小单位——基本单元。抽样单元可能包含一个或一些基本单元,最简单的情况是只包含一个基本单元。在简单随机抽样中,抽样单元即为基本单元;而在整群抽样中,群即为抽样单元,而群可能包含相当多的基本单元,比如在手机调查中我们抽中一栋居民楼,居民楼是抽样单元,而楼中的每个居民就是基本单元。