版权归原作者所有,如有侵权,请联系我们

[科普中国]-决策空间

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

概念

决策空间又称“判定空间”、“判决空间”、“行动空间”。多目标数学规划模型中可供选择的全体决策的集合。如方案、措施的总体等。它一般是有限维欧氏空间或无穷维空间的一个子集,往往是凸集。在多目标数学规划中经常是由一些等式和不等式所界定的集合。多目标数学规划是在决策空间中寻找使每个目标同时达到最优(帕累托最优)的决策。与单目标的数学规划(如:线性规划、非线性规划)有着本质的不同。多目标数学规划里的决策空间类似于线性和非线性规划l中的约束集合。2

详细介绍决策统计量所有可能取值的集合称为决策空间(decision space),用符号D表示。以阈值 为界,决策空间 分为两个子空间: ,其中3

最后,决策的结果组成结果空间或行为空间(action space)。二元假设检验的结果空间由两个元素 组成:

其中 分别表示 假设检验下的决策结果。

决策有硬决策和软决策之分:如果决策给出的是关于信号有无或者信号属性(如极性)的判断,则称为硬决策。与之不同,如果判断结果只是某个信号存在或者其属性的可能性大小(即概率),这便是软决策。在常见的二元假设检验中,通常采用硬决策。

当信号空间 (其中M>2)的元素多于两个时,称有关的检测问题为多元假设检验或M元检测。

综合以上讨论,整个决策理论空间由以下四个子空间组成:

S=信号或参数空间

Ω=观测样本空间

D=决策空间

A=行为或结果空间

图1、2、3 以二元检测问题为例,画出了决策理论空间的组成。3

相关概念决策问题决策问题有以下三个因素:4

(1)状态空间 :自然界或社会所有状态的全体;

(2)决策空间 :决策者所有可能采取决策的全体;

(3)收益函数 :自然界或社会处于状态 时,决策者所采取决策d所获收益。这种人与自然界或社会的博弈问题称为决策问题。人们为了更好地作出决策,要从自然界或社会中挖掘各种有用信息。

一般情况下,下面两种信息对决策起主要作用。

(1)先验信息。在过去对自然界或社会的各种状态所获得的信息。

(2)样本信息。从与自然界或社会的状态 有关的环境中去抽样,从获得的样本中了解当今状态 的最新信息。

统计决策问题如果在一个决策问题中还利用了样本信息,这种问题称为统计决策问题。如果在一个统计决策问题中利用了先验信息,这种问题称为Bayes决策问题。为了更好地理解统计决策问题,看如下例子。

例 某工厂的产品每100件装成一箱运交顾客,在向顾客交货前,面临如下两个决策:

:一箱中逐一检查; :一箱中都不检查。若工厂选择决策 ,则可保证交货时每件产品都是合格品,但每件产品的检查费为0.8元,为此,工厂要支付检查费80元每箱。若工厂选择决策 ,则工厂可免付检查费80元,但顾客发现不合格品时,按照合同规定,不仅更换产品,而且要支付12.5元的赔偿费。若一箱中不合格品不超过6件,赔偿费不超过75元,则决策如比决策dl有利。若一箱中不合格品超过6件,赔偿费不低于87.5元,则决策 比决策 有利。

为了得知一箱中的不合格品率 ,工厂决定先在每箱中抽取两件进行检查,X为其不合格品的件数,根据X的取值,再选择决策 。这时工厂的支付费用函数可算得

如何根据抽样结果和支付费用函数作出决策,使工厂的支付费用最少呢?这是一个典型的统计决策问题。

损失函数统计决策的一个基本观点和假定是每采取一个决策,必然有一定的后果(经济的或其他的),决策不同,后果各异。对于每个具体的统计决策问题,一般有多种优劣不同的决策可采用。例如,要估计正态分布中的参数,假设的真值为3,那么采用3.5这个决策显然比10这个决策好得多。如果要作的区间估计,则显然[2,4]这个决策比[一5,10]这个决策好。统计决策理论的一个基本思想是把上面所谈的优劣性以数量的形式表现出来,其方法是引入一个依赖于参数值和决策的二元实值非负函数,称之为损失函数,它表示当参数真值为X而采取决策d时所造成的损失,决策越好,损失就越小。由于在统计问题中人们总是利用样本对总体进行推断,所以,误差是不可避免的,因而总会带来损失,这就是损失函数定义为非负函数的原因。不同的问题所选择的损失函数不同4。