常见的差异量有平均差、方差、标准差、全距、四分差、百分差等。2
平均差一组数据( 样本)Xi,i = 1,…,N(1)的平均差公式为下图
它是算术平均数与各数据距离的平均,有效地利用了信息,能直接很好地反映这组数据的差异程度。但由于MD(平均数)用了绝对值,难以进行代数运算,理论分析困难,所以运用较少。2
方差方差的公式为下图
它是将MD中的距离改为距离的平方得到。方差可有效地利用信息,且能很好地反映这组数据的差异程度。这样改变后,虽然不如平均差反映差异那么直接,但避免了绝对值,从而进行数学处理更加方便,应用最广。2
全距全距是用来表示统计资料中的变异量数(measure sofvariation),其最大值与最小值之间的差距;即最大值减最小值后所得之数据。其适用于等距变量、比率变量,不适用于名义变量或次序变量。
全距也称为极差,是指总体各单位的两个极端标志值之差,即:R=最大标志值-最小标志值
因此,全距(R)可反映总体标志值的差异范围。2
百分差与四分差百分差与四分差只利用了数据的部分信息,不能进行代数运算,反应不灵敏,但当两极端数据不清楚或数据信息不全时,只能用百分差与四分差。
百分差计算公式:
四分差计算公式:
全距、百分差与四分差都只利用了数据的部分信息,一般是在数据信息不全,平均差和方差及其改进量不能用时选用。2
标准差标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。
标准计算公式:
几种差异量数的比较几种差异量数的比较见下图