定义
预报评分(skill-scores of forecast)是指预报准确性的定量检验方法。1预报评分方法是气象学、数理统计和信息论综合研究的一个课题。1
目的和原则目的预报评分的目的在于恰当地评价预报质量,进行不问预报方法的比较,以最终改进预报方法。1
原则① 评分标准要客观;
② 评分结果真实反映预报水平;
③ 评分要有可比性;
④要避免预报员为获取高分而产生错误的预报倾向。2
评分标准评价标准(方法)很多,从性质上可分为两种,一种是绝对度量,另一种是相对度量。
绝对度量绝对度量是样本中预报值和观测值的函数,度量预报值与观测值之间的差异。它仅考查预报本身的准确性,并未考虑技术上的优劣,所以,这种度量不具有可比性。2
常用的评分标准有预报要素场和实况要素场之间的相关系数(或其距平的相关系数)、要素场预报的平均绝对误差、相对误差、均方误差或最大误差。此外,还有量度水平气压梯度归一化预报误差的S1评分法,基于熵的概念的信息比方法等。
相对度量相对度量则是样本数量以及与参考系统相联系的预报和观测的函数,是一个样本的预报质量相对于参考系统得出的预报质量的度量,从而可以显示预报技巧,这种度量一般叫技巧评分,而参考预报,一般是随机预报、气候预报或是持续预报。2
研究历史1884年,美国陆军信号兵Finley军士对美国中东部的龙卷风预报,用他本人提出的“准确率”评分方法进行了检验评估,并发表了论文,由此引发了1884 - 1893年间人们对预报评价工作的关注,推动了预报评价概念的建立及方法的研究, Finley的预报试验也成为许多教科书和文章中阐述预报评分时常引用的典型案例。
在Finley的论文发表后6个月内,有3个人发表文章指出了Finley评分方法的不足,并提出了自己的评分方法:第一位是Gilbert,仅仅在两个月后就发表了论文,提出了一种评分方法,后被Palmer等重新发现并命名为风险评分TS(threatscore),再被Donaldson发现并命名为临界成功指数CSI(critical success index),Gilbert同时还提出了修正的CSI评分,即Gilbert技巧评分GSS(Gilbert skill score),Schaefer,Black后来也分别发现了这一技巧评分,后者称其为公平风险评分ETS(equitable threat score);第二位是Price,他提出了一种技巧评分方法,Hanssen等提出了与之近似的所谓HK判别式(Hanssen-Kuipers discriminant)或称Kuipers成绩指数(Kuipers' s performance index),Flueck在1987年提出了与Peirce技巧评分相同的所谓真实技巧统计量TSS(true skill statistic);第三位是Doolittle,先后提出了两种技巧评分,后一种就是现在使用的Heidke技巧评分HSS(Heidke skill score)。
1884— 1893年提出的这些评分方法至今仍然使用着,百余年来不断有人重新发现并命名,但关于预报检验的概念和方法并没有什么改变。2