版权归原作者所有,如有侵权,请联系我们

[科普中国]-次数分布表

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

编制步骤求全距

全距指最大数与最小数之间的差距。从被分组的数据中找出具有最大值与最小值的两个数据,然后从最大值的数据中减去最小值的数据,所得差数就是全距。

决定组数与组距组距是指每一组的间距,用符号i表示。组距经常用2、3、5、10、20等数值表示。

组数分组数目要看数据的多少,如果数据个数在100个以上,习惯上一般分10—20组,常取12—16组。如果数据的总体分布为正态,可用下面的经验公式计算组数(K),这样可使分组满足渐近最优关系。i=全距/K,为了分组方便,常取上述的一些正整数,这势必影响分组多少。一般说来,分组数目或组距小有变化时,对次数分布表作用的显示和计算的准确性,不产生很大影响。因此对组数与组距并不要求严格界定。

分组多少与哪些因素有关?我们应该如何掌握它的标准?一般说来,分组的数目多,则组距小,计算精确。但它要求总的数据量大,否则会出现有的组距内无次数分布的现象,那将使整个数据的分布规律显示不明显,也就不能发挥次数分布表的作用了。如果分组少,组距就大,计算简单,但引进计算误差较大。因此,要做到既不增加搜集数据的工作量,又能使分组后的计算精确到最大限度,那么,按上述公式分组,是一个较好的方法。

列出分组区间分组区间又称为分组阶段。列分组区间要注意以下几点:最高组区间内应能包含最大值的数据,最低组区·间应能含最小值的数据。最高组或最低组的下限最好是组距i的整数倍。这样便于确定各区间的下限与上限,减少计算。各分组区间的排列顺序,一般按纵坐标单位顺序排列,即数值大的分组区间排在上面。数值小的分组区间排在下面。为了书写方便,各分组区间只写下限的数值,然后在右侧画一横线,而且一般用整数。例如,分组区间可写为10—,20—,30—,40—等,但我们必须明确,实际上各组的精确界限应是9.5—19.499,19.5—29.499,29.5—39.499,在登记次数时,一定要按精确限划分数据的组别。

登记次数依次将数据登记到各个相应的组别内,一般用划线记数()或写正字的方法。为确保登记准确,第一次登记后需再核实登记一次。

计算次数各组的次数计算好后,还要计算总和即总次数。一是为了以后计算的需要,二是为了核对各组总和与数据的总数(N)是否相等。1

意义及缺点编制次数分布表是对数据进行分类整理的一个很重要的步骤,它可将一堆杂乱无序的数据排列成序,这个表可告诉我们:大小数据的次数是多少,其分布情况如何。同时次数分布表还可显示这一组数据的集中情况(平均值大约在78-80之间)及差异情况等。次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。2

次数分布表的类型次数分布图有直方图、次数多边形图及累加次数分布图等。在次数分布图的基础上,若对分布进行精略分析:看其变动趋势、差异细节,获得更为直观印象就要绘制次数分布图。

直方图直方图又名等距直方图,它是以矩形的面积表示连续性随机变量次数分布的图形。是常用的统计图之一。

次数多边形图次数多边形图是线图的一种,是表示连续性随机变量次数分布的图形,因此又属于次数分布图。凡是等距分组的可以用.直方图表示的数据,都可用次数多边形图来表示。

累加次数分布图累加次数分布图有累加直方图与累加曲线两种,它们都是在累加次数分布图的基础上绘制的。2