版权归原作者所有,如有侵权,请联系我们

[科普中国]-交叉分组模型

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

交叉分组模型考虑所有因子的一切水平组合,多因子析因试验结果方差分析模型。1

在交叉分组的两因素资料中,设A因素有a个水平,B因素有b个水平,A因素的每个水平与B因素的每个水平都交叉组合一次,A和B因素处于完全平等的地位。2

基本概念两因素试验资料的方差分析,是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素试验按水平组合的方式不同,分为交叉分组和系统分组两类。

交叉分组是指试验因素A的每个水平与试验因素B的每个水平都要碰到,两者交叉搭配形成AB个水平组合即处理,试验因素A、因素B在试验中处于平等地位,试验单位分成AB个组,每组随机接受一种处理。3

同时按两个定名或(和)定秩变量对数据进行分组和汇总,可以观察在两个变量各种状态交叉情况下的数据分布态势,整理的结果称为交叉表(cross table)。相对于交叉表的只按一个变量分组和汇总的即是单向表(one-way table)。

与单变量分组一样,交叉分组既可以汇总频数,也可以汇总计量值。前一种表格还有另一个名称,叫做列联表(contingency table)。对频数和汇总计量值都可以进一步计算百分比率,以各行合计值为基的百分比率称行百分比(row percent),以各列合计值为基的百分比率称列百分比(column percent),以总计为基的百分比率称总百分比(total percent)。在每个交叉格内,从上而下依次为频数、行百分比、列百分比和总百分比。4

交叉分组图在商业界,研究两组或两组以上变量之间关系的模式很普遍,我们常用交叉分组图来进行解释,可以用表格形式(列联表)或图表形式(并排图)的交叉分组图。

列联表表示两组变量的结果,交叉变量按照一个变量为行、另一个变量为列进行分类,行和列相交处称为单元格,根据列联表的结构,行和列的交叉点的单元格可以是频率、汇总的百分比、行的百分比总和或列的百分比总和。5

步骤交叉分组列表的制作步骤如下:

1)寻找最小值和最大值。喷发持续时间的最小值、最大值;到下一次喷发的间隔时间的最小值、最大值;

2)将数据分组。一般分5~20组。喷发持续时间分7组,组距为0.5;到下一次喷发的间隔时间分6组,组距为10;

3)计算频数。经观察计数,对数据中喷发持续时间在1.6~2.0分钟之间,到下一次喷发的间隔时间在41~50分钟之间的有6对。其余的依此类推。

交叉分组列表的左上角和右下角的方格中都是0。这说明喷发持续时间短但到下一次喷发的间隔时间长,以及喷发持续时间长但到下一次喷发的问隔时间短都不大可能发生。去掉这些0,中间用实线围着的灰色部分显然有向上的趋势。由交叉分组列表可以看到,喷发持续时间与到下一次喷发的间隔时间有正相关关系,而且它们的关系基本上是直线关系。6

本词条内容贡献者为:

杜强 - 高级工程师 - 中国科学院工程热物理研究所