版权归原作者所有,如有侵权,请联系我们

[科普中国]-区域样本

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

亦称面积样本。以区域为抽样单位形成的样本。由于总体中抽样单位的名册不完全或比较繁杂,往往将总体按地理区域划分为若干小区域作为抽样单位,由部分这样的抽样单位构成的样本称为区域样本。例如,居民按户口所在地划分居民区,农作物或森林按面积划分片。由居民区、农作物或森林片为抽样单位构成的样本就是区域样本。区域样本也可用于抽取商店、农场建筑物等样本。1

设计方法是一种概率样本方法,据此,最终阶段的抽样单位是土地面积,抽样概率与其面积的量度(大小)成比例。因此,将全部的调查面积完全地细分成不相重叠的切块。大部分农业普查面积样本设计都是由分层的切块概率样本组成的。层可以按土地耕种的强度、某种作物的集中种植或其它土地使用特征来确定。切块的边界是自然地面特征,如道路、河流、运河、铁路,等等,这些边界容易确定,并为切块提供了明确的标识。在这种情况下,对于每一层,切块被确定为近似同等的大小(面积),并可以使用常数抽样扩展因子从切块获得的数据取得估计值。在每一层中,样本通常包含许多抽中的独立重复样本,如果周期性地使用同一样本,这样可便于样本轮换,以减轻被调查者的负担。这样的样本设计可以被看作是对片地的分层整群抽样,它们是切块中所包含的若干经营单位(或非农业区)的部分。2

数据收集过程对具有可识别自然边界的切块,面积抽样设计一般包括年度(或季度)的现场数据收集,这是通过调查员对每一个抽中的样本切块所包含的每一片地填报一份调查表而进行的,此种方法也适用于进行普查工作。数据收集可能涉及使用放大的航空照片(或地图或按比例绘图),称为切块照片,对农业面积进行实际测量。对每一个给定的样本切块中的每一片地,调查员在切块照片上标出切块内所含片地的界线和片地中所有大田的界线,并核实每一大田中种植的作物和土地的其它使用情况,以及经营主提供的信息。然后在办公室内使用面积仪或计算机绘图系统测量每一样本切块中的农业面积,通过样本扩展步骤,为实际估计农业面积提供基础。

对于农业面积的实际测量,一个极为重要的优势是在航空照片上进行测量,特别是当被调查的经营主不知道或不想报告经营的土地面积时更是如此。

针对属于经营单位土地的切块而进行的面积样本设计一般是由调查员通过对每一抽中的经营单位填报一份调查表的方式来进行查点。数据收集可能并不涉及对农业面积的实际测量。如果需要对农业面积进行实际测量,可以使用目录样本来完成,即在地面上计量经营单位和大田,而不使用航空照片来测量。2

三阶段区域样本一种两阶段抽选择本街区的设计,再从中抽地段或街区名单上的寓所,常常对中等大小的城市来说较为适用。如果对抽取的街区具有好的数据,则对大的城市也能较满意地发挥作用。通过把它应用到县划分的各个层里,就可以把样本遍布到一个县或大城市地区。假如样本随着加入总体中新层的增加而按比例增加,我们还能继续把两阶段设计应用到一个省或者州,甚至划分成层的整个国家中。如果样本小,则试图把样本分散在一个宽广的区域的大总体——一个州、一个区或一个国家——就会产生严重的现场操作问题,我们想通过引入多阶段抽样来探讨这些问题及其解决方法。

这些问题涉及到两个费用因素:编制抽样名单费用和访问者的旅差费。如果有一个好的抽样名单,它具有街区界限,寓所数量以及可能用来分层的变量等信息,我们就能够对最大的城市很容易地抽选一个街区样本。如果对于一个县或州有这样的信息,那么假如名单是顺序排好的,从一个长的名单中抽选一个样本仍不是很费钱的事。可是如果我们必须把一张地图分成街区,而且还要附有大小度量值和分层变量,那么对大城市而言,这个工作变得令人生畏。如果对于一个州或县,则情况就变得更严重。我们也必须在现场得到街区信息。

即使可以得到街区好的名单,但对于全国性的现场访问样本,直接抽取街区由于范围太广也会很费钱。对于邮寄问卷调查,样本分布广的局限性就不存在了。在美国的电话调查,也能大大地放宽这种限制。

通过在第一阶段使用较大的单位,从而扩大一个二阶段样本的覆盖范围是可能的。例如,在第一阶段,我们抽县(在美国大陆约有3000个县)的全国性样本,或者抽镇或乡(大约为县的10到20倍)的全国性样本。但是在第二阶段直接把整个县或镇分成各个小区段,这可能很费钱。我们也许应当采用一个中间阶段,譬如说街区,因而产生三阶段设计。3

本词条内容贡献者为:

任毅如 - 副教授 - 湖南大学