版权归原作者所有,如有侵权,请联系我们

[科普中国]-样本分布

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

样本定义

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。 例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。得知这批产品的次品率的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。

这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。

对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示“任一台计算器的使用寿命”,它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量 ,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值,统计抽样的任务就是根据测试结果来估计总体X的分布情况。

我们作如下概括:设X是一个随机变量, 是一组相互独立与X具有相同分布的随机变量,称X为总体, 为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,所以 ,是一组随机变量,而在试验之后,得到一组 的观察值 ,它们则是一组确定的数值。

研究中实际观测或调查的一部分个体称为样本(sample),研究对象的全部称为总体。为了使样本能够正确反映总体情况,对总体要有明确的规定;总体内所有观察单位必须是同质的;在抽取样本的过程中,必须遵守随机化原则;样本的观察单位还要有足够的数量。又称“子样”。按照一定的抽样规则从总体中取出的一部分个体。样本中个体的数目称为“样本容量”。

如作水质检验时从井水或河水中采的水样,临床化验中从病人身上采的血液或其它活体组织标本,是样本;而整个一口井或一条河的某一段所有的水,某病人全身所有的血液或某个组织器官,则是总体。这类总体是具体存在的,但另有些总体却是假想的,只是理论上存在的一个范围。例如试验某一治疗流感新药的疗效,最初接受治疗的一批流感患者,不论数量多少,都只是一个样本。若该药疗效得到肯定,从而加以推广,那么此后凡在相同条件下接受该药治疗的所有流感患者,都属于这个总体。可是当初试用时,这个总体还并不存在,是假想的。

总体包含的观察单位通常是大量的甚至是无限的,在实际工作中,一般不可能或不必要对每个观察单位逐一进行研究。我们只能从中抽取一部分观察单位加以实际观察或调查研究,根据对这一部分观察单位的观察研究结果,再去推论和估计总体情况。如上述某新药治疗流感例子,试验治疗的只是少数有限的病人,而结论却要推广到全体,得出一个该药对所有流感患者之疗效的规律性的认识。所以说,观察样本的目的在于推论总体,这就是样本与总体的辩证关系。1

样本统计量与样本分布总体实际上就是一个随机变量X,有一定的概率分布和分布的数字特征。由于总体分布的数字特征往往也就是概率分布函数中的参数(如正态分布的数学期望和方差就是密度函数中的参数μ和σ;二项分布的数学期望和方差就是参数np和npq等),所以根据样本信息估计总体数字特征就称为参数估计。在进行参数估计时,我们并不是直接用一个个的具体样本值来估计、推测总体参数,而是根据样本值得出的一些特定的量,来估计总体参数的。由样本得出的特定的量就称为统计量,用数学的术语说,统计量就是样本的函数,它只依赖于样本,不包含任何未知参数。根据样本 ,可以计算样本均值和样本方差。样本均值和样本方差都是统计量,因为它们都是样本的函数,且不含未知的参数。样本统计量是随着样本不同而变化的量,由于样本是随机样本,所以样本统计量也是一个随机变量。显然,样本均值 随着抽取的样本不同而变化,是一个随机变量,既然是一个随机变量就有一定的概率分布,我们把样本统计量的分布称作抽样分布。

如上例,10万台微型计算机是我们研究的总体,随机抽取的100台组成一个样本,由于任意100台都可组成一个样本,所以被抽中的100台是一个随机样本,由样本计算的均值(方差、成数等)也是随机变量,这些由样本计算的特征值,称为样本统计量。

样本分布函数总体的分布函数称为总体分布函数.从总体中抽取容量为n的样本,得到n个样本观测值,设其中互不相同的观测值由小到大依次为, 则有频率分布表,其中和式是对小于x的一切的频率求和。

样本分布函数的性质

(1)

(2)是非减函数;

(3)

(4)在每个观测值处左连续,且在跳跃间断点处的跃度等于频率.

相关概念心理学概念心理两内核包括样本和丘觉,是原理心理学的最核心概念。

外界客观事物在脑中是以样本的形式表示的,样本是事物在脑中的符号,广泛分布在大脑、下丘脑、杏仁核、纹状体、小脑及其他神经结构中。样本与人脑功能密切相关,人脑的主要功能就是存储样本和进行样本分析,样本是人脑分析的工具。大脑样本的形成、分布、分析都遵循中心扩散规律,以大脑的信息传入区(如视区、听区、躯体感觉区)为中心,样本从笼统到精细向外扩散,离中心越远样本越精细;向外扩散的方向不同,样本的内容也就不同,方向差异越大内容差异越大。分析也是从中心开始向外扩散,由笼统趋于精细。中心扩散规律是主要适用后天建立的样本,如大脑样本,初生婴儿在与客观事物接触的过程中,只能形成模糊认识,建立笼统样本,进行简单分析,然后通过学习一步一步趋向精确,建立以信息传入区为中心向外精细的样本,大脑各区域的分析功能也是以信息传入区为中心向外逐步精确。当眼、耳等感觉器官接收的信息传到大脑感觉区,大脑使用已有样本一步一步进行分析,整理一个相符的样本并激活的这个样本,点亮丘觉产生意识。

对客观事物的意识,样本、联结都是后天建立的,出生婴儿既不能认识客观事物,也不能进行行为活动,需要通过学习建立代表客观事物的样本,样本的建立是在与环境的不断接触中逐步形成的,初生婴儿接触什么样的客观事物,就会建立什么样的样本,样本的建立遵循中心扩散规律,从无到有、从简单到复杂逐步形成。大脑顶枕颞叶中建立的是表示客观事物本身意义的样本;纹状体、小脑中建立的是控制运动的样本,这个样本实质上就是运动控制程序、指令;但不是所有的样本都是后天建立的,像情绪、欲望、动机这类的样本就是先天就有的,是下丘脑、杏仁核的样本;还有一些样本是非常简单的,也可以直接点亮丘觉。如一些感觉器官接受的外界信息。

样本是人脑分析的工具,建立样本的目的就是用于分析事物。大脑、下丘脑、杏仁核、纹状体、小脑等结构即是样本的存储结构,又是样本的分析结构,大脑、下丘脑、纹状体是主要的分析结构,称为分析中心。当我们看到或听到外界事物时,分析中心使用已经建立的样本分析事物,获得一个与事物相符的样本并激活这个样本,激活的样本点亮丘觉产生意识。分析过程遵循中心扩散规律,由简单走向复杂,对事物的意识也是由简单过渡到复杂。 样本:对于产品样本来说,样本就是产品的宣传资料。包括产品的外形尺寸、选型资料、基本概况等等。 例如:电气产品样本,机械产品样本。

统计学概念总体中抽取的所要考查的元素总称,样本中个体的多少叫样本容量。