版权归原作者所有,如有侵权,请联系我们

[科普中国]-显著性

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

定义

显著性表示得以相互区别的能力。在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平,对同一量,进行多次计量,然后算出平均值。对于偏离平均值的正负差值,就是其不确定度。其差值越大,则计量的不确定度就越大,对于具有特定的发生概率的随机变量,其特定的价值区间,即一个确定的数值范围(“一个区间”)就越大。1

相关概念区别显著水平指的是一个概率值;

不确定度是某个事件的概率区间;

置信区间是参考实际使用人为取的一个有效区间。

提出显著性(Significance)首次由Fisher在假设检验中提出.假设检验中有两种错误: 拒真和纳伪.显著性检验仅考虑发生拒真错误的概率,也就是考虑原假设的Significance的程度,把拒真的概率控制在提前所给定的阈值alpha之下,来考虑检验原假设是否正确。简单的说就是判断要检验的统计量是否与假设差异明显。

差异是否明显的分界概率就是显著性概率。

检验方法(一)Tukey(JohnWilderTukey)test

(1)Tukeytestformultiplecomparisons

主要应用于3组或以上的多重比较。比如说一共有4组数据,两两比较产生6个统计值,Tukey-test用于生成一个criticalvalue来控制总体误差(Familywiseerrorrate,FER),与Tukeytest相类似的是Dunnetttest,它是控制多对一比较(即3组同时和一个参照组比较)的FER。

(2)Tukeytrendtest

主要用于检验同一药物不同剂量下和参照药物的线性关系。Tukeytrendtest简单但及其高效,是生物统计学常用的方法。

(二)T-test2

T检验,这是1905年w.s.oosset氏首先提出的,当时他以“Student”为笔名发表,故至今有的书籍仍称之为“学生氏检验”。t可能是倍数的意思(times),t就是样本均数SX(x)与总体均数(“)间相距几倍标准误(sx)。t检验是用于比较两均数间相差是否显著的。

t检验过程:是对两样本均数(mean)差别的显著性进行检验。唯t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(EqualityofVariances)结果。所以,SPSS在进行t-testforEqualityofMeans的同时,也要做Levene'sTestforEqualityofVariances。

(三)单因素方差分析3

用于完全随机设计的多个样本均值间的比较,其统计推断是推断(H0)各样本所代表的各总体均数是否相等。方差分析方法适用于两组均数的比较。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

方差分析主要用途:

①均数差别的显著性检验

②分离各有关因素并估计其对总变异的作用

③分析因素间的交互作用

④方差齐性检验。

方差分析条件:

1)独立性。

2)正态性:数据必须正态分布或近似正态分布。

3)方差齐性:组间方差不齐不可用方差分析。可用Bartlett检验。

方差齐性就是不同水平的总体方差是否相同,F检验对方差齐性的偏离较为敏感

(四)曼惠特尼检验4

曼-惠特尼秩和检验:假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。(分布存在差异)

非参数检验:条件相对不苛刻,不要求服从正态分布,不需要方差相等,仍要求随机样本、观测值独立。曼惠特尼检验对样本容量,样本分布无要求。(要求数据为顺序数据)。样本量应大于7,否则效率很低。一定会大于5%

Mann-Whitney 检验不需要假定数据符合某种分布,但是要求两个分布是相同的。如果两组的分布差异比较大,可能需要数据转换使之相近。

(五)多样本非参数检验1

Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广。(秩和检验).Jonckheere-Terpstra检验有点像KW检验后进一步检验位置是否存在递增递减关系。适合不同单位时间的行为序列mmse的比较

检验统计量的构造与曼惠特尼相似,如果一个样本的观测值小于另一个样本的个数较多或较少,那么,多样本的位置之间有大小关系。(J反映了单调的趋势,J越大单调趋势越显著)

类似的,递减的检验为P(J≤c)=1-α(或构建Uij=(Xik>Xjl))。

当样本足够大时,构造Z近似于标准正态分布

(六)卡方检验(非参数检验)

卡方检验用于计数数据的分析,是对样本频数分布所来自的总体分布是否服从某种假设分布所作的假设检验。

应用赵先生开了一家日用百货公司,该公司分别在郑州和杭州开设了分公司。现在存在下列数据作为两个分公司的销售额,集合中的每一个数代表着一年中某一个月的公司销售额。

郑州分公司Z= {23,25,26,27,23,24,22,23,25,29,30}

杭州分公司H = {24,25,23,26,27,25,25,28,30,31,29}

现在,赵先生想要知道两个公司的销售额是否有存在明显的差异(是否存在郑州分公司销售额>杭州分公司销售额,抑或反之),以便对接下来公司的战略业务调整做出规划。下属们知道赵老板的难处,纷纷建议“只需要求平均值就知道哪个分公司的销售额更大了”。但是作为拥有高学历的赵先生懂得这样一件哲学即“我们生活在概率的世界之中”。那也就意味着,平均值并不能够说明什么问题,即便杭州分公司的销售额平均值大于郑州分公司的销售额平均值仍然不能说明杭州分公司的销售额一定就大于郑州分公司的销售额,因为“这样一种看似存在的大于关系实质上是偶然造成的而并不是一种必然”。

赵先生最终决定,使用方差验检查这两个数据。

最后赵先生发现,方差检验的p 值= 0.2027,那也就意味着,虽然杭州分公司的年平均销售额26.63大于郑州分公司的销售额25.18,但是实质上,两个分公司的销售额并没有明显的差异。