版权归原作者所有,如有侵权,请联系我们

[科普中国]-频率直方图

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

频率直方图(frequency histogram)亦称频率分布直方图。统计学中表示频率分布的图形。在直角坐标系中,用横轴表示随机变量的取值,横轴上的每个小区间对应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图

基本介绍设 是总体的样本,其最小值记为 ,最大值记为b,又设 是小于 的最大整数, 是大于b的最小整数,将区间 等分成m个小区间

显然,各小区间的长度均为 ,然后统计出样本观测值落入各小区间的频数 ,并计算频率 。以每个小区间为底,以 为高在平面直角坐标系内作小矩形,这些小矩形组成的图形称为频率直方图。显然第 个小矩形的面积恰好是样本观测值落人第 个小区间内的频率 。若总体X的概率密度为 ,则X的观测值落入第 个小区间内的概率为 ,其几何意义是以 为底,概率密度曲线 为顶的曲边梯形的面积,于是有

因此,当样本容量n无限增大时,频率直方图的阶梯形折线将逼近于概率密度曲线。也就是说,当n充分大时,频率直方图近似地反映了概率密度曲线的大致形状,在统计推断中常常由此提出对总体分布形式的假设1。

例题解析【例1】某地区连续50年中四月份平均气温资料如下(单位:℃):

6.9 4.1 6.6 5.2 6.4 7.9 8.6 3.0 4.4 6.7

7.1 4.7 9.1 6.8 8.6 5.2 5.8 7.9 5.6 8.8

8.1 5.7 8.4 4.1 6.4 6.2 5.2 6.8 5.6 5.6

6.8 8.2 6.4 4.8 6.9 7.1 9.7 6.4 7.3 6.8

7.1 4.8 5.8 6.5 5.9 7.3 5.5 7.4 6.2 7.7

以上述资料为依据,推断该地区四月份平均气温的分布类型。

解: 样本观测值中最小值 ,最大值 ,取 。将区间 等分为7个小区间,区间长度为1,计算样本观测值落人各小区间的频数与频率,见表1。

|| || 表1

根据表1作出频率直方图,见图1,由直方图可见,该地区四月份平均气温近似服从正态分布。

这个结论仅仅是对样本数据的统计分析,对总体分布形式提出了一个假设,它是否符合实际,还要进行检验1。

解题注意:可以根据纵轴标示区分是频数直方图还是频率直方图。

难点:从频率直方图得到数字特征(均值、中位数、众数等)。

【例2】将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于( )。

(A)80 (B)75 (C)70 (D)65 (E)60

: 频率=频数/总数,所以频率之比=频数之比,所以容量,选(E)2。

【例3】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图2所示,则其抽样的100根中,棉花纤维的长度小于20mm的约有( )根。

(A)18 (B)20 (C)22 (D)25 (E)30

:小于20 mm的频率之和为(0.01+0.01+0.04)×5=0.3,所以100根中有30根,选E2。

本词条内容贡献者为:

尚华娟 - 副教授 - 上海财经大学